Tutoriais

Qual é o orçamento de rastreamento

Índice:

Anonim

Um termo que é mencionado muito hoje na comunidade de SEO é orçamento de rastreamento. Se o traduzirmos, seria lido como "orçamento de rastreamento". É um meio termo raro, mas esse é um conceito muito antigo na área de SEO.

Quem trabalha com projetos de grande escala, como grandes e-commerce, portais de conteúdo e especialistas em SEO, entende o orçamento de rastreamento como o tempo que o Google gasta lendo as páginas do seu site em um determinado dia.

Índice de conteúdo

É o tempo que o rastreador do Google leva para ler as páginas de um site. Mas desta vez o rastreador gasta no seu site depende de vários fatores; como autoridade do site, porcentagem de conteúdo duplicado, erros de página e muito mais.

No entanto, de acordo com o blog oficial do Google para webmasters, afirma-se que nem todos devem se preocupar com essa questão do orçamento de rastreamento. Ou seja, se eles têm um site com algumas dezenas de páginas, não há necessidade de se preocupar com essa questão do rastreamento de páginas, pois o Google o fará sem problemas.

Mas se você tiver uma loja on-line ou qualquer outro projeto da Web com alguns milhares de páginas, precisará prestar muita atenção e otimizar o orçamento de rastreamento referente ao seu site.

Orçamento de rastreamento e posicionamento na web

No Google, eles afirmam que o orçamento de rastreamento não influencia o posicionamento, mas, no entanto, pode influenciar e, às vezes, controlar negativamente outros dos mais de 200 fatores a serem classificados no mecanismo de pesquisa.

Mas por que queremos que o Google rastreie as páginas do nosso site mais vezes? Por outro lado, encontramos vários especialistas em SEO que garantem que um bom orçamento de rastreamento melhore o posicionamento geral das páginas do site no ranking e, assim, aumente o tráfego orgânico.

Basicamente, o Google tem um certo tempo para gastar no seu site, uma vez que precisa decidir quanto tempo gastará em cada um dos sites ao redor do mundo, pelo qual terá que calcular quantas conexões simultâneas será capaz de fazer para leia as páginas do seu site.

A qualidade do site

O Google gasta tempo para poder se conectar ao site, ler essas páginas e interromper essa leitura. Repita isso ao longo do dia, mas sempre há uma fração do tempo. Essa fração de tempo geralmente é proporcional à autoridade do seu site, ao número de novas páginas e à relevância que ele tem contra o Google.

Isso é dado pela qualidade do seu conteúdo e pelos links que apontam para o site, ou seja, se você tem muitos links de qualidade apontando, pode ser que o Google o entenda com mais qualidade e gaste mais tempo no seu site, desde que exista um maior volume de páginas.

Em geral, o orçamento de rastreamento não muda muito para um site de 10, 50 ou 100 páginas; portanto, em algumas páginas não há muita diferença. Mas para sites grandes, se o Google tiver um segundo para acessar o site e você disser o que ler, isso será muito útil para o rastreador, concluindo sua tarefa de rastreamento mais rapidamente.

Defina quais são as páginas importantes

Primeiro, é necessário mapear uma arquitetura mais organizada das informações do site, estabelecendo quais páginas são desnecessárias e não permitindo que determinadas páginas sejam indexadas verificando o arquivo robots.txt.

O Google não deve gastar tempo na seção de pesquisa do site ou mesmo na seção em que há navegação por filtro, por exemplo, como em uma loja on-line, onde você pode escolher o tamanho do sapato, o tamanho do apartamento ou a cor da camisa. Esses filtros são o que as pessoas normalmente chamam de "navegação com face" ou "filtros de navegação".

Alguns webmasters tendem a bloquear esses filtros e as pesquisas no arquivo robots.txt, apenas para que o Google não gaste tempo lendo essas páginas, porque, na verdade, eles estão focados no usuário que está procurando por essa experiência e são conteúdos que já são disponível em outras páginas internas do site.

Recomendamos a leitura: Erros a serem evitados ao criar um site

Outra linha é que, ao estabelecer quais são as páginas importantes do seu site, você economiza o tempo do Google em páginas com conteúdo duplicado, como o caso da navegação por face, a página da política de privacidade, os termos e condições, e não você quer que eles sejam lidos. Essas páginas estarão disponíveis apenas para usuários que desejam vê-las.

Não se deve perder tempo nessas páginas de baixo valor, pois você não deseja classificá-las e elas não fazem a menor diferença em sua vida, mas precisam estar lá porque alguns usuários desejam consultar essas informações de qualquer maneira.

Como o orçamento de rastreamento funciona internamente

Em geral, o orçamento de rastreamento é baseado na arquitetura. Você define os links para as páginas que o Google poderá ler e prioriza-os pelo nível de importância.

Afinal, os links que saem dessas páginas são os que provavelmente serão priorizados pelo Google. Portanto, vale a pena pensar muito bem nos links internos e na maneira como sua página está estruturada.

O orçamento de rastreamento é o tempo que o Google gasta para poder ler, entender as informações no site e avaliar elementos como a organização da arquitetura e o bloqueio no robots.txt. O uso da tag nofollow em um link impede o Google de segui-lo. Por exemplo, se um link tiver um atributo nofollow, mas outro link interno não tiver um para acessar a página, o Google seguirá o segundo caminho, fazendo com que você gaste menos tempo.

Benefícios de um site otimizado

Existem coisas que ajudarão você a ter mais páginas lidas diariamente, o que pode ser útil para qualquer site. Por exemplo, se o seu servidor for mais rápido, o Google solicitará, nesse período, mais páginas.

Se sua página estiver compactada, o Google, nessas solicitações, solicitará mais páginas. E se você tiver um código limpo e adequado, o Google também receberá uma página mais compactada no final do dia, com bits melhores. Ou seja, a otimização do site, a velocidade do site e do servidor influenciam muito a questão do orçamento de rastreamento.

Como calcular o orçamento de rastreamento do seu site

O número de vezes que o mecanismo de pesquisa do Google rastreia seu site em um determinado período é o que chamamos de "orçamento de rastreamento". Portanto, se o Googlebot visitar seu site 32 vezes por dia, podemos dizer que o orçamento de rastreamento do Google é de aproximadamente 960 por mês.

Você pode usar ferramentas como o Google Search Console e as Ferramentas do Google para webmasters para calcular o orçamento aproximado de rastreamento do seu site. Basta fazer login e vá para Rastreamento> Estatísticas de rastreamento para ver o número médio de páginas rastreadas por dia.

Orçamento de rastreamento e SEO: eles são iguais?

Sim e não. Embora os dois tipos de otimização busquem tornar sua página mais visível e impactar seus SERPs, o SEO enfatiza mais a experiência do usuário, enquanto a otimização do spider é inteiramente para atrair bots.

A otimização de mecanismo de busca (SEO) está mais focada no processo de otimização para consultas de usuários. Em vez disso, a otimização do Googlebot se concentra em como o rastreador do Google acessa seu site.

Como otimizar o orçamento de rastreamento

Existem várias maneiras de otimizar o orçamento de rastreamento de qualquer site, dependendo de cada projeto da web, número de páginas e outros problemas. Aqui estão alguns pontos a serem considerados:

Verifique se suas páginas podem ser rastreadas

Sua página é rastreável se as aranhas dos mecanismos de pesquisa puderem encontrar e seguir links no seu site, então você precisará configurar os arquivos .htaccess e robots.txt para que eles não bloqueiem páginas críticas no seu site. Você também pode fornecer versões em texto de páginas que dependem muito de arquivos rich media, como Flash e Silverlight.

Obviamente, o inverso é verdadeiro se você deseja impedir que uma página apareça nos resultados da pesquisa. No entanto, definir o arquivo robots.txt como "não permitir" não é suficiente se você quiser impedir que uma página seja indexada. Segundo o Google, a regra "não permitir" não garante que uma página não apareça nos resultados.

Se as informações externas (por exemplo, links de entrada) continuarem direcionando tráfego para a página que você rejeitou, o Google poderá decidir que a página ainda é relevante. Nesse caso, você deve bloquear manualmente a indexação da página usando a metatag noindex ou o cabeçalho HTTP X-Robots-Tag.

- Meta tag Noindex: coloque essa meta tag na seção da sua página para impedir que a maioria dos rastreadores da web indexe sua página:

noindex "/>

- X-Robots-Tag - Coloca o seguinte na resposta do cabeçalho HTTP para instruir os rastreadores a não indexar uma página:

X-Robots-Tag: noindex

Observe que, se você usar a metatag noindex ou a X-Robots-Tag, não deverá proibir a página no robots.txt. A página deve ser rastreada antes que a tag seja vista e obedecida.

Uso cauteloso de arquivos rich media

Houve um tempo em que o Googlebot não conseguiu rastrear conteúdo como JavaScript, Flash e HTML. Esses tempos já se foram há muito tempo (embora o Googlebot ainda tenha problemas com o Silverlight e alguns outros arquivos).

No entanto, mesmo que o Google possa ler a maioria dos arquivos de mídia avançada, outros mecanismos de pesquisa podem não conseguir, o que significa que você deve usá-los criteriosamente e provavelmente evitá-los inteiramente nas páginas que deseja. posição.

Evite seqüências de redirecionamento

Todo URL que você redireciona faz com que você perca um pouco do seu orçamento de rastreamento. Quando seu site tem longas sequências de redirecionamento, ou seja, um grande número de redirecionamentos 301 e 302 seguidos, é possível que aranhas como o Googlebot travem antes de chegar à página de destino, o que significa que a página não será indexada. A melhor prática com redirecionamentos é ter o menor número possível de redirecionamentos no site e não mais do que dois seguidos.

Corrigir links quebrados

Quando perguntado a John Mueller sobre se links quebrados afetam ou não o posicionamento, ele respondeu que ele é um pouco mais focado na experiência do usuário do que para fins de posicionamento.

Essa é uma das diferenças fundamentais entre SEO e otimização do Googlebot, porque isso significaria que links quebrados não desempenham um papel substancial nas classificações, mesmo que impeçam bastante a capacidade do Googlebot de indexar e classificar um site..

Com isso dito, você deve seguir o conselho de Mueller, considerando que o algoritmo do Google melhorou substancialmente ao longo dos anos e qualquer coisa que afete a experiência do usuário provavelmente afetará os SERPs.

Definir parâmetros em URLs dinâmicos

As aranhas tratam URLs dinâmicos que levam à mesma página que páginas separadas, o que significa que você pode estar desperdiçando desnecessariamente seu orçamento de rastreamento. Você pode gerenciar os parâmetros de URL acessando o Search Console e clicando em Rastreamento> Parâmetros de URL. A partir daqui, você pode informar ao Googlebot se o seu CMS adiciona parâmetros aos seus URLs que não alteram o conteúdo de uma página.

Limpe o mapa do site

Os sitemaps XML ajudam os visitantes e os robôs-aranha, tornando o conteúdo mais organizado e mais fácil de encontrar. Portanto, tente manter o mapa do site atualizado e eliminá-lo de qualquer confusão que possa prejudicar a usabilidade do site, incluindo 400 páginas de nível, redirecionamentos desnecessários, páginas não canônicas e páginas bloqueadas.

A maneira mais fácil de limpar o mapa do site é usar uma ferramenta como o Auditor de sites. Você pode usar o gerador de sitemap XML do Website Auditor para criar um sitemap limpo que exclua todas as páginas bloqueadas da indexação. Além disso, acessando a opção “Auditoria do site”, você pode localizar e reparar todos os erros 4xx, redirecionamentos 301 e 302 e páginas não canônicas.

Faça uso de feeds

Ambos os feeds, RSS, XML e Atom, permitem que o conteúdo seja entregue aos seguidores quando eles não estão navegando no site. Isso permite que os usuários se inscrevam em seus sites favoritos e recebam atualizações regulares sempre que um novo conteúdo for publicado.

Além do fato de os feeds RSS serem uma boa maneira de aumentar o número de leitores e o envolvimento, eles também estão entre os sites mais visitados pelo Googlebot. Quando o seu site receber uma atualização (por exemplo, novos produtos, postagens de blog, atualizações de página etc.), envie-a para o Google Feed Burner para garantir a indexação correta.

Crie links externos

O edifício da ligação continua a ser um tópico importante, e não há vislumbre de que desaparecerá tão cedo.

Cultivando relacionamentos online, descobrindo novas comunidades, construindo valor da marca; Essas pequenas vitórias já devem ser impressas no seu processo de planejamento de links. Embora existam elementos distintos no desenvolvimento de links que são tão atuais em 1990, a necessidade humana de se conectar com os outros nunca mudará.

Atualmente, já temos evidências de que os links externos estão intimamente correlacionados com o número de visitas que o site recebe.

Manter a integridade do link interno

Embora a criação de links internos não tenha um papel substancial na velocidade de rastreamento, isso não significa que possa ser completamente ignorado. Uma estrutura de site bem mantida torna seu conteúdo facilmente detectável por robôs de pesquisa sem desperdiçar seu orçamento de rastreamento.

Uma estrutura de links internos bem organizada também pode melhorar a experiência do usuário, principalmente se os usuários puderem acessar qualquer área do site em três cliques. Tornar tudo mais acessível em geral significa que os visitantes ficam mais tempo, o que pode melhorar os SERPs.

Que conclusão tiramos?

Mais uma vez, reforçando o que já foi mencionado acima, essa questão do orçamento de rastreamento será importante para sites grandes com centenas e milhares de páginas, caso contrário não vale a pena se preocupar, pois o Google acompanhará seu site sem problemas.

Não devemos complicar o rastreamento das páginas do nosso site para o Google. Existem muitos sites com erros suficientes e até com barreiras criadas pelos arquivos robots.txt e sitemap.xml que impedem o Google de acessar o conteúdo. Se queremos melhorar o posicionamento no ranking do Google, precisamos autorizar e simplificar as páginas do site para que o Google possa acessar, indexar e posicionar rapidamente. Muito simples

Até agora, você provavelmente já percebeu uma tendência neste artigo: As práticas recomendadas para rastreabilidade também tendem a melhorar a capacidade de pesquisa. Portanto, se você está se perguntando se a otimização do orçamento de rastreamento é importante para o seu site, a resposta é sim.

Simplificando, se você facilitar a descoberta e a indexação do site, o Google desfrutará de mais rastreamento, o que significa atualizações mais rápidas ao publicar um novo conteúdo. Você também melhorará a experiência geral do usuário, melhorando a visibilidade e, finalmente, a classificação dos SERPs.

Esses são apenas alguns dos pontos, entre muitos outros, para melhorar e otimizar o orçamento de rastreamento de um site.

Tutoriais

Escolha dos editores

Back to top button