O Trafego de Bots de IA Esta Acelerando Rapidamente. 48 Dias de Logs de Servidor Revelam o Que GPTBot, ChatGPT, ClaudeBot e 16 Outros Estao Fazendo.
O Trafego de Bots de IA Ja Nao e um Gotejamento
Entre fevereiro e meados de marco de 2026, a atividade de bots de IA no wislr.com nao apenas cresceu. Ela mudou de forma.
- O trafego do ChatGPT-User aumentou 5x em sete semanas
- GPTBot, completamente ausente ate 12 de marco, executou 187 requisicoes em uma unica semana, 152 delas em uma rajada de 3 minutos
- O GPTBot nao e novo. E o crawler principal de treinamento da OpenAI, ativo na web ha anos. Mas ele nao parece rastrear todos os sites continuamente. Os dados sugerem que ele se ativa em um site depois que o conteudo desse site ganha tracao no ecossistema da OpenAI. As referencias do ChatGPT-User para o wislr.com ja tinham aumentado 5x antes do GPTBot aparecer.
- O volume do OAI-SearchBot aumentou 4x
- Em 18-19 de marco, tanto ClaudeBot quanto GPTBot comecaram a solicitar sitemap.xml pela primeira vez, no mesmo dia, de empresas diferentes
Isso e uma mudanca na forma como as plataformas de IA descobrem e indexam conteudo.
20 Conclusoes para o Seu Proprio Site
- O Google Analytics nao consegue ver nada disso. Os bots de IA nao executam JavaScript. Se voce depende de analitica do lado do cliente, seu trafego de bots de IA e invisivel. O registro no lado do servidor e a unica forma de medi-lo.
- Seu sitemap.xml acabou de se tornar mais importante. GPTBot e ClaudeBot comecaram a consumir sitemaps em marco de 2026 pela primeira vez. Se seu sitemap esta desatualizado, incompleto ou sem variantes de idioma, os crawlers de IA perderao conteudo.
- O robots.txt nao e respeitado universalmente. GPTBot e Meta-WebIndexer nunca o verificam. Se sua estrategia de conteudo para IA depende de diretivas do robots.txt, saiba que dois dos crawlers mais ativos os ignoram completamente.
- Conteudo multilinguistico recebe atencao de rastreamento desproporcional. Bots como Meta-WebIndexer (80%), GPTBot (62%) e Bingbot (60%) gastam a maior parte do seu orcamento em variantes de idioma. Se voce publica conteudo traduzido, as plataformas de IA estao indexando-o de forma agressiva.
- O trafego do ChatGPT-User e um sinal direto de citacao da marca em conversas de IA. Cada requisicao representa uma pessoa real colando sua URL no ChatGPT. Isso e o boca a boca mensuravel, e esta crescendo rapidamente.
- Os bots de IA rastreiam em rajadas, nao em fluxos constantes. O GPTBot atingiu 114 req/min em uma janela de 3 minutos. Se o seu servidor nao consegue lidar com trafego em rajadas, os crawlers de IA podem ser limitados ou encontrar erros durante suas execucoes de indexacao.
- OpenAI e Anthropic operam 3 bots separados cada uma. Um para treinamento/indexacao, um para busca, um para sessoes de usuarios ao vivo. Bloquear um nao bloqueia os outros. Seu robots.txt precisa de diretivas separadas para cada um.
- OAI-SearchBot e Googlebot sao os unicos bots que buscam imagens em volume. Se as imagens dos seus artigos carregam conteudo significativo (graficos, diagramas, visualizacoes de dados), esses sao os bots que as usarao nos resultados de busca.
- O ChatGPT-User so extrai texto. Zero imagens, zero CSS, zero JS. Seu conteudo HTML e o que e puxado para as conversas de IA. Texto estruturado e claro importa mais do que design visual para visibilidade em IA.
- Os crawlers de IA tem picos em horarios diferentes. O GPTBot atinge o pico as 04:00 UTC. O Claude-SearchBot atinge o pico durante a noite. O PerplexityBot tem rajadas as 23:00, 05:00 e 09:00. Se voce implanta mudancas no site fora do horario de pico dos EUA, os bots de IA podem ser os primeiros a ve-las.
- Meta e o crawler de IA mais agressivo por volume. O Meta-WebIndexer enviou mais requisicoes do que qualquer outro bot neste dataset, com zero verificacoes de robots.txt. Se voce nao esta rastreando os crawlers da Meta, esta perdendo o maior player.
- A adocao do llms.txt ainda e teorica. Zero bots de IA solicitaram /llms.txt em 48 dias. Pode se tornar um padrao eventualmente, mas nenhum crawler o procura atualmente.
- O Applebot renderiza suas paginas completamente. Ele busca CSS, JS e imagens (47% do seu trafego). Se seu conteudo requer renderizacao JavaScript para ficar completo, o Applebot o vera, mas a maioria dos bots de IA nao.
- O trafego do ChatGPT-User e distribuido globalmente. 15 paises, 584 IPs unicos. Seu conteudo esta sendo referenciado em conversas de IA no mundo inteiro, nao apenas nos EUA.
- Conteudo tecnico e tutoriais sao os mais referenciados em conversas de IA. As paginas mais acessadas pelo ChatGPT-User foram todas guias de implementacao e explicacoes tecnicas. Conteudo profundo e especifico conquista citacoes em IA.
- Bytespider e CCBot apenas verificam o robots.txt e nunca rastreiam. Eles consomem suas diretivas de robots.txt sem dar continuidade. Isso pode mudar, mas atualmente geram sobrecarga de conformidade sem nenhuma indexacao de conteudo.
- O volume de rastreamento de IA pode mudar da noite para o dia. O GPTBot foi de 0 a 187 requisicoes em uma unica semana. Suas projecoes de orcamento de rastreamento precisam considerar mudancas bruscas, nao crescimento gradual.
- A analise de IP revela a identidade do bot. A proporcao quase 1:1 de IP por requisicao do ChatGPT-User comprova sessoes de usuarios individuais. Os 2 IPs do GPTBot comprovam infraestrutura centralizada. Padroes de IP ajudam a distinguir buscas acionadas por usuarios reais de rastreamento automatizado.
- Eventos de rastreamento coordenados acontecem entre familias de bots. GPTBot e OAI-SearchBot dispararam simultaneamente em 19 de marco a partir da mesma infraestrutura Microsoft. Quando um bot da OpenAI acelera, espere que os outros sigam.
- Os bots dos quais voce nunca ouviu falar ja estao visitando. PromptingBot, LinkupBot, Brightbot, Observer e outros estao rastreando conteudo ativamente. O panorama de bots de IA e maior do que os nomes mais conhecidos sugerem.
Os Dados
Fonte: 288.566 arquivos de log de registro de requisicoes CDN no wislr.com
Periodo: 1 de fevereiro a 20 de marco de 2026
Total de requisicoes: 71.603
Requisicoes de bots de IA/crawlers analisadas: 12.099 (16,9% de todo o trafego)
Cada requisicao HTTP ao wislr.com passa por um script CDN que captura metadados completos da requisicao (user agent, geolocalizacao, cabecalhos, tempo de resposta). Isso nos da a verdade absoluta sobre exatamente o que os bots de IA estao fazendo, com que frequencia e o que estao lendo.
Quer esse nivel de visibilidade no trafego de bots de IA do seu proprio site?
Agende uma ConversaRanking de Volume de Bots
| Posicao | Bot | Total de Hits | Fev | Mar (parcial) | Tendencia |
|---|---|---|---|---|---|
| 1 | Meta-WebIndexer | 1.833 | 707 | 1.126 | +59% |
| 2 | Bingbot | 1.221 | 547 | 674 | +23% |
| 3 | ChatGPT-User | 923 | 230 | 693 | +201% |
| 4 | Googlebot | 816 | 386 | 430 | +11% |
| 5 | Claude-SearchBot | 549 | 216 | 333 | +54% |
| 6 | Applebot | 495 | 257 | 238 | -7% |
| 7 | PerplexityBot | 456 | 244 | 212 | -13% |
| 8 | OAI-SearchBot | 330 | 117 | 213 | +82% |
| 9 | ClaudeBot | 206 | 69 | 137 | +99% |
| 10 | GPTBot* | 187 | 0 | 187 | Novo em marco |
| 11 | Amazonbot | 71 | 27 | 44 | +63% |
| 12 | Bytespider | 68 | 33 | 35 | +6% |
| 13 | Claude-User | 18 | 6 | 12 | +100% |
| 14 | CCBot | 5 | 2 | 3 | Minimo |
| 15 | Meta-ExternalAgent | 4 | 0 | 4 | Novo |
| 16 | DuckAssistBot | 4 | 0 | 4 | Novo |
| 17 | Perplexity-User | 3 | 3 | 0 | Minimo |
| 18 | YouBot | 2 | 0 | 2 | Novo |
| 19 | GoogleOther | 2 | 1 | 1 | Minimo |
*O GPTBot nao e um bot novo. E o crawler principal de treinamento da OpenAI, ativo na web ha anos. “Novo em marco” significa novo neste site. Os dados sugerem que o GPTBot se ativa em um site depois que seu conteudo ganha tracao no ecossistema da OpenAI: as referencias do ChatGPT-User ja tinham aumentado 5x antes do GPTBot aparecer.
Tendencias de Volume Semanal
| Bot | Fev S1 | Fev S2 | Fev S3 | Fev S4 | Mar S1 | Mar S2 | Mar S3 |
|---|---|---|---|---|---|---|---|
| GPTBot | 0 | 0 | 0 | 0 | 0 | 4 | 183 |
| ChatGPT-User | 39 | 66 | 65 | 60 | 72 | 304 | 317 |
| OAI-SearchBot | 28 | 34 | 29 | 26 | 28 | 46 | 139 |
| ClaudeBot | 10 | 14 | 9 | 36 | 51 | 24 | 62 |
| Claude-SearchBot | 31 | 51 | 47 | 87 | 121 | 68 | 144 |
| PerplexityBot | 22 | 132 | 62 | 28 | 37 | 77 | 98 |
| Bingbot | 132 | 163 | 136 | 116 | 151 | 248 | 275 |
| Meta-WebIndexer | 63 | 35 | 271 | 338 | 396 | 541 | 189 |
| Amazonbot | 8 | 6 | 7 | 6 | 2 | 2 | 40 |
Mar S3 (15-20 de mar) foi uma semana de ruptura. O GPTBot explodiu de quase zero para 183 requisicoes. O ChatGPT-User sustentou 300+/semana (5x sua linha de base de fevereiro). O OAI-SearchBot atingiu 139, um salto de 4x. Algo coordenado aconteceu na frota de bots da OpenAI.
Perfis Individuais de Bots
GPTBot (crawler de treinamento/indexacao da OpenAI)
Total: 187 requisicoes | Ativo desde: 12 de marco | IPs: 2 (altamente concentrados)
O GPTBot nao e um bot novo. A OpenAI o define como o crawler usado para “tornar nossos modelos generativos de IA fundamentais mais uteis e seguros”, rastreando conteudo que pode ser usado no treinamento de seus modelos fundamentais. Ele opera na web ha anos. O notavel aqui e que o GPTBot estava completamente ausente do wislr.com ate 12 de marco, entao ativou com uma rajada massiva de rastreamento em 19 de marco as 04:38 UTC: 152 requisicoes em 3 minutos (pico de 114 req/min). Ele rastreou sistematicamente cada artigo em cada variante de idioma.
Isso sugere que o GPTBot nao rastreia todos os sites continuamente. Ele parece se ativar e escalar em um site depois que o conteudo desse site ganha tracao no ecossistema da OpenAI, ja que as referencias do ChatGPT-User para o wislr.com ja estavam em 5x antes do GPTBot aparecer.
O que ele rastreia:
- Artigos: 67% das requisicoes
- Variantes de idioma: 61,5%, rastreou todas as 11 versoes de idioma (de, fr, pl, hi, nl, uk, pt, ms, tr, it, es)
- Imagens: 28 requisicoes (cabecalhos de artigos, fotos de autor)
- Sitemap.xml: 2 requisicoes (comecou em 19 de mar, comportamento completamente novo)
- robots.txt: Zero. Nunca verifica.
Horario de rastreamento: 81% de todas as requisicoes as 04:00 UTC. Padrao de rajada extremo, quase todo o trafego em uma unica janela de 3 minutos.
Infraestrutura: Roda a partir do ASN Microsoft Limited, apenas EUA. 97,9% do trafego de um unico IP.
A rajada do GPTBot em 19 de marco foi simultanea a uma rajada do OAI-SearchBot a partir da mesma infraestrutura Microsoft: 50 req/min no mesmo timestamp. Isso parece coordenado.
OAI-SearchBot (crawler de busca da OpenAI)
Total: 330 requisicoes | Tendencia: +82% de fev para mar | IPs: 81
O OAI-SearchBot e o crawler de busca dedicado da OpenAI, distinto do GPTBot. E o verificador mais persistente de robots.txt entre todos os bots de IA, acessando-o 3 a 6 vezes por dia, todos os dias, sem excecao.
O que ele rastreia:
- robots.txt: 54,5% de todo o trafego (180 hits, media de 3,8/dia)
- Artigos: 52 requisicoes
- Imagens: 55 requisicoes, baixa ativamente imagens de artigos, fotos de autor, capturas de tela
- Pagina inicial: 9 requisicoes
Horario de rastreamento: Distribuido ao longo do dia com leves picos as 04:00 e 20:00 UTC.
Infraestrutura: Microsoft Limited (87%) + Microsoft Corp (13%), apenas EUA.
O unico bot da OpenAI que respeita o robots.txt (verifica de forma obsessiva). Tambem o unico bot de IA alem do Googlebot que busca imagens em volume ativamente, provavelmente para cards de resultados de busca.
ChatGPT-User (buscador de sessao de usuario ao vivo)
Total: 923 requisicoes | Tendencia: +201% de fev para mar | IPs: 584
Isso nao e um crawler. Ele e acionado quando uma pessoa real cola uma URL do wislr.com em uma conversa do ChatGPT. Os 584 IPs unicos (quase 1:1 com as requisicoes) confirmam que sao sessoes de usuarios individuais. Este e o sinal mais claro de com que frequencia o conteudo do wislr.com esta sendo citado em conversas de IA.
Conteudo mais referenciado:
| Hits | Artigo |
|---|---|
| 225 | Shopify Same-Domain Checkout Analytics |
| 112 | Cloudflare Crawl Endpoint Pros and Cons |
| 103 | Cloudflare Crawl Best Settings |
| 91 | Cloudflare CDN Request Logging for Shopify |
| 81 | 6 Core Tasks for Better 301 Redirects |
| 50 | AI Performance Metrics: Seven KPIs |
| 37 | Homepage |
| 30 | Essential Tools for Site Migrations |
| 29 | OpenAI KPIs and Success Metrics 2026 |
| 23 | AEO Readiness Comparison |
O que ele nao busca: Zero imagens, zero CSS, zero JS. Extracao pura de conteudo HTML, so quer o texto.
Horario de rastreamento: Distribuido uniformemente ao longo das 24 horas, segue padroes de uso humano.
Distribuicao geografica: EUA (50%), Polonia (16%), Australia (5%), Espanha (5%), Japao (5%), Brasil (4%), 15 paises no total. Principais cidades: Varsovia (149), Phoenix (145), San Antonio (126), Des Moines (91).
ClaudeBot (crawler de treinamento/indexacao da Anthropic)
Total: 206 requisicoes | Tendencia: +99% de fev para mar | IPs: 22
O ClaudeBot e predominantemente focado na verificacao de conformidade: 85% do seu trafego e robots.txt.
O que ele rastreia:
- robots.txt: 175 requisicoes (85%), aumentou de 1-2/dia no inicio de fev para 6-12/dia em marco
- Sitemap.xml: 14 requisicoes, comecou em 18 de marco (nunca o acessou antes)
- Imagens: 10 requisicoes (todas em 18 de marco)
- Paginas de conteudo: muito poucas
O ClaudeBot verifica o robots.txt de forma cada vez mais agressiva ao longo do tempo. Seu interesse repentino no sitemap.xml em 18 de marco (5 hits nesse dia, 8 em 19 de marco) sugere o lancamento de uma nova estrategia de rastreamento da Anthropic.
Infraestrutura: ASN Anthropic, PBC (97%), apenas EUA.
Claude-SearchBot (crawler de busca web da Anthropic)
Total: 549 requisicoes | Tendencia: +54% de fev para mar | IPs: 8
Um bot da Anthropic separado, distinto do ClaudeBot e Claude-User. Este alimenta o recurso de busca web do Claude. Mais agressivo que o ClaudeBot, realmente rastreia conteudo.
O que ele rastreia:
- robots.txt: 164 requisicoes (30%), diariamente, aumentando de 1-3 para 7-10/dia
- Sitemap.xml: 135 requisicoes, comecou em 25 de fev, rapidamente se tornou o segundo consumidor de sitemap mais ativo depois do Bingbot
- Artigos: 142 requisicoes (26%)
- Variantes de idioma: 23,3% do trafego
- Pagina inicial: 45 requisicoes
Horario de rastreamento: Concentrado no periodo noturno, picos as 22:00, 01:00, 00:00 UTC.
Combinados, a Anthropic opera 3 bots distintos (ClaudeBot, Claude-SearchBot, Claude-User) totalizando 773 requisicoes, tornando a Anthropic a terceira maior presenca de bots de IA depois do Meta-WebIndexer e ChatGPT-User.
Claude-User (buscador de sessao ao vivo da Anthropic)
Total: 18 requisicoes | IPs: 8
O equivalente Anthropic do ChatGPT-User. E acionado quando alguem compartilha uma URL em uma conversa do Claude. Volume muito menor que o ChatGPT-User (18 vs 923).
O que ele rastreia: robots.txt (9), depois artigos sobre Cloudflare e um estudo de caso de escritorio de advocacia.
Infraestrutura: ASN Google LLC (100%), apenas EUA. Roda atraves do Google Cloud, nao da infraestrutura propria da Anthropic.
PerplexityBot (crawler de indexacao da Perplexity)
Total: 456 requisicoes | Tendencia: -13% de fev para mar | IPs: 13
Padrao de rastreamento em rajadas: 132 requisicoes na S2 de fev, cai para 28 na S4 de fev, volta para 98 na S3 de mar.
O que ele rastreia:
- Artigos: 77% do trafego, prioriza fortemente conteudo sobre metricas de desempenho de IA
- robots.txt: 71 requisicoes (constante 1-4/dia)
- Imagens: 18 requisicoes (imagens especificas de artigos)
- Sitemap.xml: Zero. Nunca solicita.
- Variantes de idioma: 52,9%, ampla cobertura multilinguistica
Horario de rastreamento: Tres janelas de rajada distintas as 23:00, 05:00 e 09:00 UTC.
Infraestrutura: Amazon Technologies Inc. (96%), apenas EUA. 13 IPs, concentracao moderada.
Googlebot
Total: 816 requisicoes | IPs: 72
Focado na pagina inicial (27% do trafego) e o crawler com “renderizacao mais completa”. Busca imagens, CSS, JS junto com o conteudo.
O que ele rastreia:
- Pagina inicial: 220 requisicoes (27%)
- Imagens: 152 requisicoes
- CSS: 132 requisicoes
- JS: 54 requisicoes
- Artigos: 141 requisicoes
- robots.txt: 68 requisicoes
- Sitemap.xml: 5 requisicoes (ocasional)
Variantes de idioma: Apenas 10,4%, significativamente menos multilinguistico que outros bots.
Infraestrutura: Google LLC (91%), alguns da Suecia (8%). Padrao de rastreamento uniforme de 24 horas.
Bingbot
Total: 1.221 requisicoes | Tendencia: +23% de fev para mar | IPs: 258
O crawler mais consistente e abrangente. Tambem o principal consumidor de sitemaps.
O que ele rastreia:
- Artigos: 68% (com ampla cobertura de variantes de idioma)
- Sitemap.xml: 139 requisicoes (2-8/dia, todos os dias), de longe o crawler de sitemap mais ativo
- Imagens: 78 requisicoes (icones sociais, PNGs de dashboard, imagens de artigos)
- robots.txt: 36 requisicoes
Variantes de idioma: 60,3%, forte foco em variantes em holandes (97) e alemao (98).
Horario de rastreamento: Cobertura uniforme de 24 horas, sempre ativo.
Meta-WebIndexer
Total: 1.833 requisicoes | Tendencia: +59% de fev para mar | IPs: 156
O bot com maior volume geral. Predominantemente focado em conteudo, especialmente variantes de idioma.
O que ele rastreia:
- Artigos: 88% do trafego
- Variantes de idioma: 79,8%, de longe o crawler multilinguistico mais agressivo
- Sitemap.xml: 30 requisicoes
- robots.txt: Zero. Nao verifica o robots.txt.
Horario de rastreamento: Concentrado no periodo noturno, picos as 20:00-21:00 e 00:00-01:00 UTC.
Infraestrutura: ASN Meta Platforms Ireland Ltd, apenas EUA.
Assim como o GPTBot, o Meta-WebIndexer nao verifica o robots.txt. Diferente do GPTBot, ele esteve consistentemente ativo durante todo o periodo.
Padroes Comportamentais
Conformidade com robots.txt
| Comportamento | Bots |
|---|---|
| Verificadores obsessivos (varias vezes por dia) | OAI-SearchBot (3,8/dia), ClaudeBot (4/dia), Claude-SearchBot (4/dia) |
| Verificadores regulares (diariamente ou quase) | PerplexityBot, Googlebot, Applebot, Amazonbot, FacebookExternalHit (exatamente 1/dia como um relogio) |
| So verifica robots.txt, nada mais | Bytespider (100%), CCBot (100%) |
| Nunca verifica robots.txt | GPTBot, Meta-WebIndexer, ChatGPT-User |
GPTBot e Meta-WebIndexer sao os bots nao conformes mais notaveis. Eles rastreiam agressivamente sem nunca verificar as regras.
Descoberta de Sitemap
| Bot | Hits no Sitemap | Primeira Requisicao | Padrao |
|---|---|---|---|
| Bingbot | 139 | 1 de fev | Diario, 2-8/dia (o rei do sitemap) |
| Claude-SearchBot | 135 | 25 de fev | Intenso, tornou-se o 2o mais ativo |
| Meta-WebIndexer | 30 | 5 de fev | Regular |
| ClaudeBot | 14 | 18 de mar | Comportamento completamente novo |
| Googlebot | 5 | 2 de fev | Ocasional |
| GPTBot | 2 | 19 de mar | Comportamento completamente novo |
| Applebot | 1 | 17 de mar | Hit unico |
18-19 de marco marca uma mudanca. Tanto ClaudeBot quanto GPTBot comecaram a solicitar sitemap.xml pela primeira vez, sugerindo lancamentos de novas estrategias de rastreamento da Anthropic e OpenAI simultaneamente.
llms.txt / Requisicoes de Arquivos Especificos para IA
Nenhum bot de IA solicita /llms.txt ou /llm.txt. Zero hits de GPTBot, ClaudeBot, PerplexityBot ou qualquer outro crawler de IA.
O unico bot que verifica o llms.txt e o Dataprovider.com (uma empresa de analitica web): 3 requisicoes entre fev-mar.
Duas requisicoes por /.well-known/ai-plugin.json vieram de navegadores Firefox, nao de bots.
Rastreamento de Variantes de Idioma
| Bot | % do Trafego em Variantes de Idioma | Cobertura |
|---|---|---|
| Meta-WebIndexer | 79,8% | Todos os 11 idiomas, distribuidos uniformemente |
| GPTBot | 61,5% | Todos os 11 idiomas, 8-12 cada |
| Bingbot | 60,3% | Todos os 11, forte em holandes/alemao |
| PerplexityBot | 52,9% | Todos os 11, alemao/espanhol no topo |
| Amazonbot | 32,4% | Todos os 11 |
| Claude-SearchBot | 23,3% | Todos os 11, razoavelmente uniforme |
| Applebot | 23,0% | Todos os 11 |
| OAI-SearchBot | 11,2% | Todos os 11 |
| Googlebot | 10,4% | Espanhol/portugues no topo |
| ChatGPT-User | 4,7% | Frances/espanhol/italiano (orientado pelo usuario) |
Meta-WebIndexer e GPTBot sao os crawlers multilinguisticos mais agressivos. A baixa porcentagem do ChatGPT-User faz sentido: reflete em quais idiomas os usuarios reais estao lendo.
Rastreamento de Imagens
| Bot | Requisicoes de Imagens | O Que Buscam |
|---|---|---|
| Googlebot | 152 | Icones SVG, logos, favicons, ativos de renderizacao |
| Google-InspectionTool | 108 | Icones sociais, imagens de estudos de caso |
| Googlebot-Image | 75 | Favicon, variantes de logo, imagens de artigos |
| Bingbot | 78 | Icones sociais, PNGs de dashboard, imagens de artigos |
| OAI-SearchBot | 55 | Imagens de artigos, fotos de autor, capturas de tela |
| Applebot | 32 | Imagens de capa de artigos |
| GPTBot | 28 | Cabecalhos de artigos, fotos de autor (todas em 19 de mar) |
| PerplexityBot | 18 | Imagens de artigos |
| ClaudeBot | 10 | Foto de autor, capturas de tela (todas em 18 de mar) |
| ChatGPT-User | 0 | Nunca busca imagens |
O Googlebot busca imagens para renderizacao. O OAI-SearchBot provavelmente as busca para cards de resultados de busca. GPTBot e ClaudeBot fizeram rajadas concentradas de imagens em um unico dia cada, sugerindo execucoes de indexacao em lote.
O ChatGPT-User busca zero imagens. Extracao pura de texto.
Outros Bots Notaveis Descobertos
PromptingBot/1.0.0 (104 requisicoes)
- Roda na infraestrutura Google Cloud
- Ativo de 24 de fev a 13 de mar
- Faz renderizacao completa de pagina (busca CSS, JS, imagens, icones sociais)
- Prioriza conteudo sobre metricas de desempenho de IA
LinkupBot/1.0 (47 requisicoes)
- Do linkup.so, um servico de indexacao web
- Infraestrutura Microsoft, origem: Franca
- Verifica robots.txt, depois foca em conteudo de migracao/redirecionamento
Brightbot 1.0 (46 requisicoes)
- Da truview LLC, 41 IPs unicos
- Foca em variantes em idioma holandes
Observer/1.0 (36 requisicoes)
- Do obsrvr.net, infraestrutura alema/finlandesa
- So rastreia robots.txt e um unico artigo em frances
Dataprovider.com (148 requisicoes)
- Empresa canadense de analitica web
- O unico bot que verifica /llms.txt (3 vezes)
- Tambem verifica /ads.txt e /humans.txt
Metodos HTTP
Todos os bots usam exclusivamente GET. Zero HEAD, POST ou outros metodos em todas as 12.099 requisicoes de bots.
Dados de Pais/ASN
| Bot | ASN Primario | Paises |
|---|---|---|
| GPTBot | Microsoft Limited | Apenas EUA |
| OAI-SearchBot | Microsoft Limited (87%) + Microsoft Corp (13%) | Apenas EUA |
| ChatGPT-User | Microsoft Corporation (78%) | EUA (50%), Polonia (16%), Australia (5%), Espanha (5%), Japao (5%), Brasil (4%), 15 paises |
| ClaudeBot | Anthropic, PBC (97%) | Apenas EUA |
| Claude-SearchBot | Anthropic, PBC (100%) | Apenas EUA |
| Claude-User | Google LLC (100%) | Apenas EUA |
| PerplexityBot | Amazon Technologies Inc. (96%) | Apenas EUA |
| Amazonbot | Amazon (100%) | Apenas EUA |
| Applebot | Apple Inc. (100%) | Apenas EUA |
| Bingbot | Microsoft Corporation (99,7%) | Apenas EUA |
| Googlebot | Google LLC (91%) | EUA (92%), Suecia (8%) |
| Meta-WebIndexer | Meta Platforms Ireland Ltd (100%) | Apenas EUA |
| Bytespider | Amazon Singapore (53%), China Unicom (47%) | Singapura (53%), China (47%) |
Todos os principais bots de IA rodam a partir de infraestrutura nos EUA, exceto o Bytespider (Singapura/China). O ChatGPT-User e o unico bot com distribuicao verdadeiramente global, refletindo sua base de usuarios humanos.
Perguntas Frequentes
Quais bots de IA estao visitando sites com mais frequencia em 2026?
Com base em 48 dias de dados de logs de servidor do wislr.com, os bots de IA com maior volume sao Meta-WebIndexer (1.833 requisicoes), ChatGPT-User (923 requisicoes), Claude-SearchBot (549 requisicoes), Applebot (495 requisicoes), PerplexityBot (456 requisicoes), OAI-SearchBot (330 requisicoes), ClaudeBot (206 requisicoes) e GPTBot (187 requisicoes). O ChatGPT-User apresentou o crescimento mais acentuado, com +201% entre fevereiro e marco de 2026.
Os bots de IA verificam o robots.txt antes de rastrear?
Varia bastante. O OAI-SearchBot verifica o robots.txt 3 a 6 vezes por dia, sem excecao. ClaudeBot e Claude-SearchBot verificam 4 vezes por dia em media. Bytespider e CCBot apenas verificam o robots.txt e nunca rastreiam nenhum conteudo real. No entanto, GPTBot e Meta-WebIndexer nunca verificam o robots.txt, apesar de estarem entre os crawlers mais ativos. O ChatGPT-User tambem nunca verifica o robots.txt.
Algum bot de IA solicita o llms.txt?
Nao. Em 12.099 requisicoes de bots ao longo de 48 dias, zero bots de IA solicitaram /llms.txt ou /llm.txt. O unico bot que verificou o llms.txt foi o Dataprovider.com, uma empresa de analitica web, nao uma plataforma de IA. Apesar da crescente discussao sobre o llms.txt como padrao, nenhum crawler de IA o procura atualmente na pratica.
Qual e a diferenca entre GPTBot e ChatGPT-User?
O GPTBot e o crawler de treinamento e indexacao da OpenAI que rastreia sistematicamente paginas, variantes de idioma e imagens em rajadas concentradas, frequentemente sem verificar o robots.txt. O ChatGPT-User e acionado quando uma pessoa real cola uma URL numa conversa do ChatGPT. O ChatGPT-User teve 584 IPs unicos para 923 requisicoes (quase 1:1), confirmando sessoes de usuarios individuais. O ChatGPT-User so busca texto HTML, nunca imagens, CSS ou JS. O GPTBot busca todos os tipos de ativos.
Como voce pode detectar trafego de bots de IA no seu site?
O trafego de bots de IA e invisivel para ferramentas de analitica do lado do cliente como o Google Analytics porque os bots nao executam JavaScript. Voce precisa de registro de requisicoes no lado do servidor que capture as requisicoes HTTP brutas que chegam ao seu dominio, incluindo o cabecalho User-Agent que identifica bots como GPTBot, ChatGPT-User, ClaudeBot e outros. O WISLR AI Visibility Dashboard fornece esse nivel de visibilidade de forma nativa.
Quais bots de IA rastreiam conteudo multilinguistico de forma mais agressiva?
O Meta-WebIndexer gasta 79,8% do seu orcamento de rastreamento em variantes de idioma, tornando-o o crawler multilinguistico mais agressivo. O GPTBot vem em seguida com 61,5%, rastreando todas as 11 versoes de idioma dos artigos. Bingbot (60,3%) e PerplexityBot (52,9%) tambem priorizam fortemente conteudo multilinguistico. O Googlebot e notavelmente menos multilinguistico, com apenas 10,4%. A baixa taxa de 4,7% do ChatGPT-User reflete que ele e impulsionado por usuarios humanos, nao por rastreamento automatizado.