Conhecendo os diferentes robôs do Google
Postado em 31 de março de 2008 em Desenvolvimento Web
Hoje estava passeando pelo WebInsider quando li o artigo do Alexandre Kavinski, que trata a respeito dos diferentes robôs do Google e me lembrou dos posts que já escrevi aqui e que este do Alexandre vem a complementá-los…
Para quem não acompanhou a série de dicas sobre a indexação nos mecanismos de busca, segue abaixo os links:
» Dicas sobre indexação em sites de busca – Introdução
» Dicas sobre indexação em sites de busca – Conclusão
Algo que notei que não foi falado na minha série e não é explicada aqui que é sobre o arquivo robots.txt. Para quem não sabe, este arquivo auxilia na questão do controle quanto ao o que sua página mostrará aos mecanismos de busca. Serve muito para quem tem certas páginas que não devem ser indexadas.
A essa altura do campeonato quase todo mundo já sabe que os buscadores (como Google, Yahoo, etc) se utilizam de robôs (spiders) para vasculhar a web e alimentar seus bancos de dados.
O que nem todos sabem é que diferentes robôs de um mesmo buscador, neste caso o Google, podem ter uma influência diferente na maneira como o Google vê, indexa e dá relevância para seu site ou páginas do site.
Vamos conhecer os diferentes robôs de indexação do Google:
» Google Image Bot (agente: Googlebot-Image)
Como o próprio nome já diz, este robô é responsável pela indexação de imagens no Google Images. A periodicidade deste robô é muito menor que a do robô de indexação de páginas, visitando as páginas apenas algumas vezes ao ano, portanto é comum que leve muito mais tempo para ver suas imagens indexadas no Google Images.
Para quem prefere não indexar as imagens de seu site, é possÃvel utilizar o seguinte arquivo robots.txt no index do site…
User-agent: Googlebot-Image
Disallow: /
» Google Mobile Bot (agente: Googlebot-Mobile)
Não é bem um robô de indexação, mas sim um robô que ajuda um usuário de mobile na navegação; portanto é um robô, mas significa uma visita (usuário real). Este robô pega o conteúdo da página e tenta transformá-lo num formato mais compatÃvel para as telinhas dos telefones (XHTML).
Muitos webmasters preferem coibir a ação deste robô para que não haja interferência no formato do conteúdo disponibilizado nas páginas. Para excluir no robot.txt, basta incluir o código:
User-agent: Googlebot-Mobile
Disallow: /
» Google AdSense Bot (agente: Mediapartners-google)
Este robô rastreia o código dos parceiros de publicidade do Google (AdSense) especialmente para entender o conteúdo das páginas para melhor direcionar os anúncios de sua rede de conteúdo.
Uma coisa muito importante é que o Google (na pessoa do lendário Matt Cutts) já confirmou que o robô do AdSense ajuda o robô de indexação do Google (Googlebot) a encontrar novas páginas. Portanto disponibilizar anúncios do Google nas páginas de seu site pode ajudar e acelerar a indexação de seu conteúdo nos resultados de busca orgânica do Google.
» Google AdWords Bot (agente: AdsBot-Google)
Este robô é voltado para os anunciantes de links patrocinados. Atualmente a relevância de um link patrocinado no Google é dada por uma série de fatores que compõem o chamado Quality Score. Entre estes fatores inclui-se a relevância do conteúdo das páginas (landing page do anúncio) em relação à palavra-chave e texto do anúncio. O AdWords Bot portanto vai fazer esta tarefa de verificar o conteúdo.
Este robô também pode ser bloqueado (como todos), mas neste caso o fator de relevância do Quality Score que considera seu conteúdo será penalizado e seu CPC pode (e provavelmente irá) subir. Para não penalizar aqueles que bloqueiam o acesso de todos os agentes, o AdsBot ignora bloqueios gerais (user-agent:*).
» Googlebot (agente: Googlebot/2.1)
Finalmente chegamos ao famoso robô de indexação orgânica do Google. O Googlebot (o original) é o responsável por encontrar e indexar o infindável universo de páginas da web. Embora utilize o mesmo agente (Googlebot/2.1) estamos falando de dois robôs, com funções distintas e diferenciados pelo número de IP, conforme vemos a seguir:
» FreshBot (agente: Googlebot/2.1)
A função do FreshBot, também carinhosamente apelidado de Minty, é vasculhar a web e encontrar novos conteúdos, novas páginas e novos sites. O Freshbot é bastante ativo e o grande responsável pelo GoogleDance*, que provoca altos e baixos nos resultados.
O Freshbot pode ser reconhecido pelo número inicial de IP “64.” e em uma ação de SEO é importante para manter seu conteúdo sempre atualizado nos resultados do Google. Quanto maior a freqüência de atualizações de suas páginas, maior a freqüência de visitação do Freshbot.
» DeepBot (agente: Googlebot/2.1)
O Deepbot é menos ativo, aparece normalmente uma vez por mês, após a varredura do FreshBot durando sua ação em média uma semana. Para SEO, o DeepBot normalmente tem maior importância por ser o verdadeiro responsável por alimentar as páginas no banco de dados do Google e por ser aquele que avalia a estrutura de links dos sites para atribuir o Page Rank.
O Freshbot pode ser reconhecido pelo número inicial de IP “216.”
Os robôs do Google não param por aà – existem robôs para indexação de RSS, NotÃcias, etc. Todos têm suas particularidades e podem ser utilizados de uma maneira ou de outra para ações de SEO.
*Curiosidade: Google Dance também é o nome das festas realizadas pelo Google (no Brasil e no mundo) para seus funcionários, parceiros e clientes.
Artigo escrito por Alexandre Kavinski no Webinsiders
Joares Miranda
Webdesigner, twitteiro, blogueiro. Para alguns, um falso nerd, acho que por conta de não perder a chance de gastar horas num bom papo off-line
Ver todos os posts de Joares Miranda | Twitter: @joares
Publicidade - Skybanner
Enquete da semana
Posts recentes
- Site reúne fotos de carros órfãos
- A anatomia dos produtos da Apple
- Homens de verdade desenham fuzis no Paint
- Pendrive em forma de arma #euquero
- Sony lança Bravia 3D com sensor de movimento
- Cubo mágico para cegos
- CutMp3.net – ferramenta online para editar arquivos mp3
- LG POP, o touchscreen barato da LG
- Três modos de preparar cabeça de Steve Jobs com queijo
- Divulgue seu currÃculo no Twitter
- Oblique Clock, um relógio para malucos
- MacMote: Controle seu Mac com o celular
- Nokia N900 x Samsung Omnia2 x iPhone 3G S. Qual o melhor?
- Pedra, papel e tesoura para pessoas solitárias #euquero
- Alternative To – Um excelente site para quem procura uma alternativa para um aplicativo
Publicidade - miniquadrados submarino
Categorias
- Apple
- Aprenda NumClique
- Blogosfera
- Campus Party
- Celulares
- Comédia
- Como fazer
- Curiosidades
- Desenvolvimento Web
- Design Web
- Destaque
- Dica de Site
- Enquete da Semana
- Eu quero
- Filmes
- FireFox
- Fotografia
- Imagem do dia
- Internet
- Jogo da semana
- Jogos
- Linux
- Microsoft
- Review
- Software
- Tecnologia
- Tirinhas
- VÃdeos
Arquivo
- março 2010
- fevereiro 2010
- janeiro 2010
- dezembro 2009
- novembro 2009
- outubro 2009
- setembro 2009
- agosto 2009
- julho 2009
- junho 2009
- maio 2009
- abril 2009
- março 2009
- fevereiro 2009
- janeiro 2009
- dezembro 2008
- novembro 2008
- outubro 2008
- setembro 2008
- agosto 2008
- julho 2008
- junho 2008
- maio 2008
- abril 2008
- março 2008
- fevereiro 2008
- janeiro 2008












Quem linkou este post
Conhecendo os diferentes robôs do Google » NumClique – Informar é simples!…
Muita gente tem a curiosidade em saber como é feita a indexação nos sites de busca. Depois de compreendida a maneira a qual é feita, vem uma nova dúvida… cada buscador, possui apenas um tipo de robô? Claro que não, neste post você conhecerá …