← All Articles

O Trafego de Bots de IA Esta Acelerando Rapidamente. 48 Dias de Logs de Servidor Revelam o Que GPTBot, ChatGPT, ClaudeBot e 16 Outros Estao Fazendo.

Analise de trafego de bots de IA a partir de 48 dias de logs de servidor mostrando GPTBot, ChatGPT-User, ClaudeBot e 16 outros bots

O Trafego de Bots de IA Ja Nao e um Gotejamento

Entre fevereiro e meados de marco de 2026, a atividade de bots de IA no wislr.com nao apenas cresceu. Ela mudou de forma.

  • O trafego do ChatGPT-User aumentou 5x em sete semanas
  • GPTBot, completamente ausente ate 12 de marco, executou 187 requisicoes em uma unica semana, 152 delas em uma rajada de 3 minutos
    • O GPTBot nao e novo. E o crawler principal de treinamento da OpenAI, ativo na web ha anos. Mas ele nao parece rastrear todos os sites continuamente. Os dados sugerem que ele se ativa em um site depois que o conteudo desse site ganha tracao no ecossistema da OpenAI. As referencias do ChatGPT-User para o wislr.com ja tinham aumentado 5x antes do GPTBot aparecer.
  • O volume do OAI-SearchBot aumentou 4x
  • Em 18-19 de marco, tanto ClaudeBot quanto GPTBot comecaram a solicitar sitemap.xml pela primeira vez, no mesmo dia, de empresas diferentes

Isso e uma mudanca na forma como as plataformas de IA descobrem e indexam conteudo.


20 Conclusoes para o Seu Proprio Site

  1. O Google Analytics nao consegue ver nada disso. Os bots de IA nao executam JavaScript. Se voce depende de analitica do lado do cliente, seu trafego de bots de IA e invisivel. O registro no lado do servidor e a unica forma de medi-lo.
  2. Seu sitemap.xml acabou de se tornar mais importante. GPTBot e ClaudeBot comecaram a consumir sitemaps em marco de 2026 pela primeira vez. Se seu sitemap esta desatualizado, incompleto ou sem variantes de idioma, os crawlers de IA perderao conteudo.
  3. O robots.txt nao e respeitado universalmente. GPTBot e Meta-WebIndexer nunca o verificam. Se sua estrategia de conteudo para IA depende de diretivas do robots.txt, saiba que dois dos crawlers mais ativos os ignoram completamente.
  4. Conteudo multilinguistico recebe atencao de rastreamento desproporcional. Bots como Meta-WebIndexer (80%), GPTBot (62%) e Bingbot (60%) gastam a maior parte do seu orcamento em variantes de idioma. Se voce publica conteudo traduzido, as plataformas de IA estao indexando-o de forma agressiva.
  5. O trafego do ChatGPT-User e um sinal direto de citacao da marca em conversas de IA. Cada requisicao representa uma pessoa real colando sua URL no ChatGPT. Isso e o boca a boca mensuravel, e esta crescendo rapidamente.
  6. Os bots de IA rastreiam em rajadas, nao em fluxos constantes. O GPTBot atingiu 114 req/min em uma janela de 3 minutos. Se o seu servidor nao consegue lidar com trafego em rajadas, os crawlers de IA podem ser limitados ou encontrar erros durante suas execucoes de indexacao.
  7. OpenAI e Anthropic operam 3 bots separados cada uma. Um para treinamento/indexacao, um para busca, um para sessoes de usuarios ao vivo. Bloquear um nao bloqueia os outros. Seu robots.txt precisa de diretivas separadas para cada um.
  8. OAI-SearchBot e Googlebot sao os unicos bots que buscam imagens em volume. Se as imagens dos seus artigos carregam conteudo significativo (graficos, diagramas, visualizacoes de dados), esses sao os bots que as usarao nos resultados de busca.
  9. O ChatGPT-User so extrai texto. Zero imagens, zero CSS, zero JS. Seu conteudo HTML e o que e puxado para as conversas de IA. Texto estruturado e claro importa mais do que design visual para visibilidade em IA.
  10. Os crawlers de IA tem picos em horarios diferentes. O GPTBot atinge o pico as 04:00 UTC. O Claude-SearchBot atinge o pico durante a noite. O PerplexityBot tem rajadas as 23:00, 05:00 e 09:00. Se voce implanta mudancas no site fora do horario de pico dos EUA, os bots de IA podem ser os primeiros a ve-las.
  11. Meta e o crawler de IA mais agressivo por volume. O Meta-WebIndexer enviou mais requisicoes do que qualquer outro bot neste dataset, com zero verificacoes de robots.txt. Se voce nao esta rastreando os crawlers da Meta, esta perdendo o maior player.
  12. A adocao do llms.txt ainda e teorica. Zero bots de IA solicitaram /llms.txt em 48 dias. Pode se tornar um padrao eventualmente, mas nenhum crawler o procura atualmente.
  13. O Applebot renderiza suas paginas completamente. Ele busca CSS, JS e imagens (47% do seu trafego). Se seu conteudo requer renderizacao JavaScript para ficar completo, o Applebot o vera, mas a maioria dos bots de IA nao.
  14. O trafego do ChatGPT-User e distribuido globalmente. 15 paises, 584 IPs unicos. Seu conteudo esta sendo referenciado em conversas de IA no mundo inteiro, nao apenas nos EUA.
  15. Conteudo tecnico e tutoriais sao os mais referenciados em conversas de IA. As paginas mais acessadas pelo ChatGPT-User foram todas guias de implementacao e explicacoes tecnicas. Conteudo profundo e especifico conquista citacoes em IA.
  16. Bytespider e CCBot apenas verificam o robots.txt e nunca rastreiam. Eles consomem suas diretivas de robots.txt sem dar continuidade. Isso pode mudar, mas atualmente geram sobrecarga de conformidade sem nenhuma indexacao de conteudo.
  17. O volume de rastreamento de IA pode mudar da noite para o dia. O GPTBot foi de 0 a 187 requisicoes em uma unica semana. Suas projecoes de orcamento de rastreamento precisam considerar mudancas bruscas, nao crescimento gradual.
  18. A analise de IP revela a identidade do bot. A proporcao quase 1:1 de IP por requisicao do ChatGPT-User comprova sessoes de usuarios individuais. Os 2 IPs do GPTBot comprovam infraestrutura centralizada. Padroes de IP ajudam a distinguir buscas acionadas por usuarios reais de rastreamento automatizado.
  19. Eventos de rastreamento coordenados acontecem entre familias de bots. GPTBot e OAI-SearchBot dispararam simultaneamente em 19 de marco a partir da mesma infraestrutura Microsoft. Quando um bot da OpenAI acelera, espere que os outros sigam.
  20. Os bots dos quais voce nunca ouviu falar ja estao visitando. PromptingBot, LinkupBot, Brightbot, Observer e outros estao rastreando conteudo ativamente. O panorama de bots de IA e maior do que os nomes mais conhecidos sugerem.

Os Dados

Fonte: 288.566 arquivos de log de registro de requisicoes CDN no wislr.com
Periodo: 1 de fevereiro a 20 de marco de 2026
Total de requisicoes: 71.603
Requisicoes de bots de IA/crawlers analisadas: 12.099 (16,9% de todo o trafego)

Cada requisicao HTTP ao wislr.com passa por um script CDN que captura metadados completos da requisicao (user agent, geolocalizacao, cabecalhos, tempo de resposta). Isso nos da a verdade absoluta sobre exatamente o que os bots de IA estao fazendo, com que frequencia e o que estao lendo.

Quer esse nivel de visibilidade no trafego de bots de IA do seu proprio site?

Agende uma Conversa

Ranking de Volume de Bots

Posicao Bot Total de Hits Fev Mar (parcial) Tendencia
1 Meta-WebIndexer 1.833 707 1.126 +59%
2 Bingbot 1.221 547 674 +23%
3 ChatGPT-User 923 230 693 +201%
4 Googlebot 816 386 430 +11%
5 Claude-SearchBot 549 216 333 +54%
6 Applebot 495 257 238 -7%
7 PerplexityBot 456 244 212 -13%
8 OAI-SearchBot 330 117 213 +82%
9 ClaudeBot 206 69 137 +99%
10 GPTBot* 187 0 187 Novo em marco
11 Amazonbot 71 27 44 +63%
12 Bytespider 68 33 35 +6%
13 Claude-User 18 6 12 +100%
14 CCBot 5 2 3 Minimo
15 Meta-ExternalAgent 4 0 4 Novo
16 DuckAssistBot 4 0 4 Novo
17 Perplexity-User 3 3 0 Minimo
18 YouBot 2 0 2 Novo
19 GoogleOther 2 1 1 Minimo

*O GPTBot nao e um bot novo. E o crawler principal de treinamento da OpenAI, ativo na web ha anos. “Novo em marco” significa novo neste site. Os dados sugerem que o GPTBot se ativa em um site depois que seu conteudo ganha tracao no ecossistema da OpenAI: as referencias do ChatGPT-User ja tinham aumentado 5x antes do GPTBot aparecer.


Tendencias de Volume Semanal

Bot Fev S1 Fev S2 Fev S3 Fev S4 Mar S1 Mar S2 Mar S3
GPTBot 0 0 0 0 0 4 183
ChatGPT-User 39 66 65 60 72 304 317
OAI-SearchBot 28 34 29 26 28 46 139
ClaudeBot 10 14 9 36 51 24 62
Claude-SearchBot 31 51 47 87 121 68 144
PerplexityBot 22 132 62 28 37 77 98
Bingbot 132 163 136 116 151 248 275
Meta-WebIndexer 63 35 271 338 396 541 189
Amazonbot 8 6 7 6 2 2 40

Mar S3 (15-20 de mar) foi uma semana de ruptura. O GPTBot explodiu de quase zero para 183 requisicoes. O ChatGPT-User sustentou 300+/semana (5x sua linha de base de fevereiro). O OAI-SearchBot atingiu 139, um salto de 4x. Algo coordenado aconteceu na frota de bots da OpenAI.


Perfis Individuais de Bots


GPTBot (crawler de treinamento/indexacao da OpenAI)

Total: 187 requisicoes | Ativo desde: 12 de marco | IPs: 2 (altamente concentrados)

O GPTBot nao e um bot novo. A OpenAI o define como o crawler usado para “tornar nossos modelos generativos de IA fundamentais mais uteis e seguros”, rastreando conteudo que pode ser usado no treinamento de seus modelos fundamentais. Ele opera na web ha anos. O notavel aqui e que o GPTBot estava completamente ausente do wislr.com ate 12 de marco, entao ativou com uma rajada massiva de rastreamento em 19 de marco as 04:38 UTC: 152 requisicoes em 3 minutos (pico de 114 req/min). Ele rastreou sistematicamente cada artigo em cada variante de idioma.

Isso sugere que o GPTBot nao rastreia todos os sites continuamente. Ele parece se ativar e escalar em um site depois que o conteudo desse site ganha tracao no ecossistema da OpenAI, ja que as referencias do ChatGPT-User para o wislr.com ja estavam em 5x antes do GPTBot aparecer.

O que ele rastreia:

  • Artigos: 67% das requisicoes
  • Variantes de idioma: 61,5%, rastreou todas as 11 versoes de idioma (de, fr, pl, hi, nl, uk, pt, ms, tr, it, es)
  • Imagens: 28 requisicoes (cabecalhos de artigos, fotos de autor)
  • Sitemap.xml: 2 requisicoes (comecou em 19 de mar, comportamento completamente novo)
  • robots.txt: Zero. Nunca verifica.

Horario de rastreamento: 81% de todas as requisicoes as 04:00 UTC. Padrao de rajada extremo, quase todo o trafego em uma unica janela de 3 minutos.

Infraestrutura: Roda a partir do ASN Microsoft Limited, apenas EUA. 97,9% do trafego de um unico IP.

A rajada do GPTBot em 19 de marco foi simultanea a uma rajada do OAI-SearchBot a partir da mesma infraestrutura Microsoft: 50 req/min no mesmo timestamp. Isso parece coordenado.


OAI-SearchBot (crawler de busca da OpenAI)

Total: 330 requisicoes | Tendencia: +82% de fev para mar | IPs: 81

O OAI-SearchBot e o crawler de busca dedicado da OpenAI, distinto do GPTBot. E o verificador mais persistente de robots.txt entre todos os bots de IA, acessando-o 3 a 6 vezes por dia, todos os dias, sem excecao.

O que ele rastreia:

  • robots.txt: 54,5% de todo o trafego (180 hits, media de 3,8/dia)
  • Artigos: 52 requisicoes
  • Imagens: 55 requisicoes, baixa ativamente imagens de artigos, fotos de autor, capturas de tela
  • Pagina inicial: 9 requisicoes

Horario de rastreamento: Distribuido ao longo do dia com leves picos as 04:00 e 20:00 UTC.

Infraestrutura: Microsoft Limited (87%) + Microsoft Corp (13%), apenas EUA.

O unico bot da OpenAI que respeita o robots.txt (verifica de forma obsessiva). Tambem o unico bot de IA alem do Googlebot que busca imagens em volume ativamente, provavelmente para cards de resultados de busca.


ChatGPT-User (buscador de sessao de usuario ao vivo)

Total: 923 requisicoes | Tendencia: +201% de fev para mar | IPs: 584

Isso nao e um crawler. Ele e acionado quando uma pessoa real cola uma URL do wislr.com em uma conversa do ChatGPT. Os 584 IPs unicos (quase 1:1 com as requisicoes) confirmam que sao sessoes de usuarios individuais. Este e o sinal mais claro de com que frequencia o conteudo do wislr.com esta sendo citado em conversas de IA.

Conteudo mais referenciado:

Hits Artigo
225 Shopify Same-Domain Checkout Analytics
112 Cloudflare Crawl Endpoint Pros and Cons
103 Cloudflare Crawl Best Settings
91 Cloudflare CDN Request Logging for Shopify
81 6 Core Tasks for Better 301 Redirects
50 AI Performance Metrics: Seven KPIs
37 Homepage
30 Essential Tools for Site Migrations
29 OpenAI KPIs and Success Metrics 2026
23 AEO Readiness Comparison

O que ele nao busca: Zero imagens, zero CSS, zero JS. Extracao pura de conteudo HTML, so quer o texto.

Horario de rastreamento: Distribuido uniformemente ao longo das 24 horas, segue padroes de uso humano.

Distribuicao geografica: EUA (50%), Polonia (16%), Australia (5%), Espanha (5%), Japao (5%), Brasil (4%), 15 paises no total. Principais cidades: Varsovia (149), Phoenix (145), San Antonio (126), Des Moines (91).


ClaudeBot (crawler de treinamento/indexacao da Anthropic)

Total: 206 requisicoes | Tendencia: +99% de fev para mar | IPs: 22

O ClaudeBot e predominantemente focado na verificacao de conformidade: 85% do seu trafego e robots.txt.

O que ele rastreia:

  • robots.txt: 175 requisicoes (85%), aumentou de 1-2/dia no inicio de fev para 6-12/dia em marco
  • Sitemap.xml: 14 requisicoes, comecou em 18 de marco (nunca o acessou antes)
  • Imagens: 10 requisicoes (todas em 18 de marco)
  • Paginas de conteudo: muito poucas

O ClaudeBot verifica o robots.txt de forma cada vez mais agressiva ao longo do tempo. Seu interesse repentino no sitemap.xml em 18 de marco (5 hits nesse dia, 8 em 19 de marco) sugere o lancamento de uma nova estrategia de rastreamento da Anthropic.

Infraestrutura: ASN Anthropic, PBC (97%), apenas EUA.


Claude-SearchBot (crawler de busca web da Anthropic)

Total: 549 requisicoes | Tendencia: +54% de fev para mar | IPs: 8

Um bot da Anthropic separado, distinto do ClaudeBot e Claude-User. Este alimenta o recurso de busca web do Claude. Mais agressivo que o ClaudeBot, realmente rastreia conteudo.

O que ele rastreia:

  • robots.txt: 164 requisicoes (30%), diariamente, aumentando de 1-3 para 7-10/dia
  • Sitemap.xml: 135 requisicoes, comecou em 25 de fev, rapidamente se tornou o segundo consumidor de sitemap mais ativo depois do Bingbot
  • Artigos: 142 requisicoes (26%)
  • Variantes de idioma: 23,3% do trafego
  • Pagina inicial: 45 requisicoes

Horario de rastreamento: Concentrado no periodo noturno, picos as 22:00, 01:00, 00:00 UTC.

Combinados, a Anthropic opera 3 bots distintos (ClaudeBot, Claude-SearchBot, Claude-User) totalizando 773 requisicoes, tornando a Anthropic a terceira maior presenca de bots de IA depois do Meta-WebIndexer e ChatGPT-User.


Claude-User (buscador de sessao ao vivo da Anthropic)

Total: 18 requisicoes | IPs: 8

O equivalente Anthropic do ChatGPT-User. E acionado quando alguem compartilha uma URL em uma conversa do Claude. Volume muito menor que o ChatGPT-User (18 vs 923).

O que ele rastreia: robots.txt (9), depois artigos sobre Cloudflare e um estudo de caso de escritorio de advocacia.

Infraestrutura: ASN Google LLC (100%), apenas EUA. Roda atraves do Google Cloud, nao da infraestrutura propria da Anthropic.


PerplexityBot (crawler de indexacao da Perplexity)

Total: 456 requisicoes | Tendencia: -13% de fev para mar | IPs: 13

Padrao de rastreamento em rajadas: 132 requisicoes na S2 de fev, cai para 28 na S4 de fev, volta para 98 na S3 de mar.

O que ele rastreia:

  • Artigos: 77% do trafego, prioriza fortemente conteudo sobre metricas de desempenho de IA
  • robots.txt: 71 requisicoes (constante 1-4/dia)
  • Imagens: 18 requisicoes (imagens especificas de artigos)
  • Sitemap.xml: Zero. Nunca solicita.
  • Variantes de idioma: 52,9%, ampla cobertura multilinguistica

Horario de rastreamento: Tres janelas de rajada distintas as 23:00, 05:00 e 09:00 UTC.

Infraestrutura: Amazon Technologies Inc. (96%), apenas EUA. 13 IPs, concentracao moderada.


Googlebot

Total: 816 requisicoes | IPs: 72

Focado na pagina inicial (27% do trafego) e o crawler com “renderizacao mais completa”. Busca imagens, CSS, JS junto com o conteudo.

O que ele rastreia:

  • Pagina inicial: 220 requisicoes (27%)
  • Imagens: 152 requisicoes
  • CSS: 132 requisicoes
  • JS: 54 requisicoes
  • Artigos: 141 requisicoes
  • robots.txt: 68 requisicoes
  • Sitemap.xml: 5 requisicoes (ocasional)

Variantes de idioma: Apenas 10,4%, significativamente menos multilinguistico que outros bots.

Infraestrutura: Google LLC (91%), alguns da Suecia (8%). Padrao de rastreamento uniforme de 24 horas.


Bingbot

Total: 1.221 requisicoes | Tendencia: +23% de fev para mar | IPs: 258

O crawler mais consistente e abrangente. Tambem o principal consumidor de sitemaps.

O que ele rastreia:

  • Artigos: 68% (com ampla cobertura de variantes de idioma)
  • Sitemap.xml: 139 requisicoes (2-8/dia, todos os dias), de longe o crawler de sitemap mais ativo
  • Imagens: 78 requisicoes (icones sociais, PNGs de dashboard, imagens de artigos)
  • robots.txt: 36 requisicoes

Variantes de idioma: 60,3%, forte foco em variantes em holandes (97) e alemao (98).

Horario de rastreamento: Cobertura uniforme de 24 horas, sempre ativo.


Meta-WebIndexer

Total: 1.833 requisicoes | Tendencia: +59% de fev para mar | IPs: 156

O bot com maior volume geral. Predominantemente focado em conteudo, especialmente variantes de idioma.

O que ele rastreia:

  • Artigos: 88% do trafego
  • Variantes de idioma: 79,8%, de longe o crawler multilinguistico mais agressivo
  • Sitemap.xml: 30 requisicoes
  • robots.txt: Zero. Nao verifica o robots.txt.

Horario de rastreamento: Concentrado no periodo noturno, picos as 20:00-21:00 e 00:00-01:00 UTC.

Infraestrutura: ASN Meta Platforms Ireland Ltd, apenas EUA.

Assim como o GPTBot, o Meta-WebIndexer nao verifica o robots.txt. Diferente do GPTBot, ele esteve consistentemente ativo durante todo o periodo.


Padroes Comportamentais

Conformidade com robots.txt

Comportamento Bots
Verificadores obsessivos (varias vezes por dia) OAI-SearchBot (3,8/dia), ClaudeBot (4/dia), Claude-SearchBot (4/dia)
Verificadores regulares (diariamente ou quase) PerplexityBot, Googlebot, Applebot, Amazonbot, FacebookExternalHit (exatamente 1/dia como um relogio)
So verifica robots.txt, nada mais Bytespider (100%), CCBot (100%)
Nunca verifica robots.txt GPTBot, Meta-WebIndexer, ChatGPT-User

GPTBot e Meta-WebIndexer sao os bots nao conformes mais notaveis. Eles rastreiam agressivamente sem nunca verificar as regras.

Descoberta de Sitemap

Bot Hits no Sitemap Primeira Requisicao Padrao
Bingbot 139 1 de fev Diario, 2-8/dia (o rei do sitemap)
Claude-SearchBot 135 25 de fev Intenso, tornou-se o 2o mais ativo
Meta-WebIndexer 30 5 de fev Regular
ClaudeBot 14 18 de mar Comportamento completamente novo
Googlebot 5 2 de fev Ocasional
GPTBot 2 19 de mar Comportamento completamente novo
Applebot 1 17 de mar Hit unico

18-19 de marco marca uma mudanca. Tanto ClaudeBot quanto GPTBot comecaram a solicitar sitemap.xml pela primeira vez, sugerindo lancamentos de novas estrategias de rastreamento da Anthropic e OpenAI simultaneamente.

llms.txt / Requisicoes de Arquivos Especificos para IA

Nenhum bot de IA solicita /llms.txt ou /llm.txt. Zero hits de GPTBot, ClaudeBot, PerplexityBot ou qualquer outro crawler de IA.

O unico bot que verifica o llms.txt e o Dataprovider.com (uma empresa de analitica web): 3 requisicoes entre fev-mar.

Duas requisicoes por /.well-known/ai-plugin.json vieram de navegadores Firefox, nao de bots.

Rastreamento de Variantes de Idioma

Bot % do Trafego em Variantes de Idioma Cobertura
Meta-WebIndexer 79,8% Todos os 11 idiomas, distribuidos uniformemente
GPTBot 61,5% Todos os 11 idiomas, 8-12 cada
Bingbot 60,3% Todos os 11, forte em holandes/alemao
PerplexityBot 52,9% Todos os 11, alemao/espanhol no topo
Amazonbot 32,4% Todos os 11
Claude-SearchBot 23,3% Todos os 11, razoavelmente uniforme
Applebot 23,0% Todos os 11
OAI-SearchBot 11,2% Todos os 11
Googlebot 10,4% Espanhol/portugues no topo
ChatGPT-User 4,7% Frances/espanhol/italiano (orientado pelo usuario)

Meta-WebIndexer e GPTBot sao os crawlers multilinguisticos mais agressivos. A baixa porcentagem do ChatGPT-User faz sentido: reflete em quais idiomas os usuarios reais estao lendo.

Rastreamento de Imagens

Bot Requisicoes de Imagens O Que Buscam
Googlebot 152 Icones SVG, logos, favicons, ativos de renderizacao
Google-InspectionTool 108 Icones sociais, imagens de estudos de caso
Googlebot-Image 75 Favicon, variantes de logo, imagens de artigos
Bingbot 78 Icones sociais, PNGs de dashboard, imagens de artigos
OAI-SearchBot 55 Imagens de artigos, fotos de autor, capturas de tela
Applebot 32 Imagens de capa de artigos
GPTBot 28 Cabecalhos de artigos, fotos de autor (todas em 19 de mar)
PerplexityBot 18 Imagens de artigos
ClaudeBot 10 Foto de autor, capturas de tela (todas em 18 de mar)
ChatGPT-User 0 Nunca busca imagens

O Googlebot busca imagens para renderizacao. O OAI-SearchBot provavelmente as busca para cards de resultados de busca. GPTBot e ClaudeBot fizeram rajadas concentradas de imagens em um unico dia cada, sugerindo execucoes de indexacao em lote.

O ChatGPT-User busca zero imagens. Extracao pura de texto.

Outros Bots Notaveis Descobertos

PromptingBot/1.0.0 (104 requisicoes)

  • Roda na infraestrutura Google Cloud
  • Ativo de 24 de fev a 13 de mar
  • Faz renderizacao completa de pagina (busca CSS, JS, imagens, icones sociais)
  • Prioriza conteudo sobre metricas de desempenho de IA

LinkupBot/1.0 (47 requisicoes)

  • Do linkup.so, um servico de indexacao web
  • Infraestrutura Microsoft, origem: Franca
  • Verifica robots.txt, depois foca em conteudo de migracao/redirecionamento

Brightbot 1.0 (46 requisicoes)

  • Da truview LLC, 41 IPs unicos
  • Foca em variantes em idioma holandes

Observer/1.0 (36 requisicoes)

  • Do obsrvr.net, infraestrutura alema/finlandesa
  • So rastreia robots.txt e um unico artigo em frances

Dataprovider.com (148 requisicoes)

  • Empresa canadense de analitica web
  • O unico bot que verifica /llms.txt (3 vezes)
  • Tambem verifica /ads.txt e /humans.txt

Metodos HTTP

Todos os bots usam exclusivamente GET. Zero HEAD, POST ou outros metodos em todas as 12.099 requisicoes de bots.


Dados de Pais/ASN

Bot ASN Primario Paises
GPTBot Microsoft Limited Apenas EUA
OAI-SearchBot Microsoft Limited (87%) + Microsoft Corp (13%) Apenas EUA
ChatGPT-User Microsoft Corporation (78%) EUA (50%), Polonia (16%), Australia (5%), Espanha (5%), Japao (5%), Brasil (4%), 15 paises
ClaudeBot Anthropic, PBC (97%) Apenas EUA
Claude-SearchBot Anthropic, PBC (100%) Apenas EUA
Claude-User Google LLC (100%) Apenas EUA
PerplexityBot Amazon Technologies Inc. (96%) Apenas EUA
Amazonbot Amazon (100%) Apenas EUA
Applebot Apple Inc. (100%) Apenas EUA
Bingbot Microsoft Corporation (99,7%) Apenas EUA
Googlebot Google LLC (91%) EUA (92%), Suecia (8%)
Meta-WebIndexer Meta Platforms Ireland Ltd (100%) Apenas EUA
Bytespider Amazon Singapore (53%), China Unicom (47%) Singapura (53%), China (47%)

Todos os principais bots de IA rodam a partir de infraestrutura nos EUA, exceto o Bytespider (Singapura/China). O ChatGPT-User e o unico bot com distribuicao verdadeiramente global, refletindo sua base de usuarios humanos.



Perguntas Frequentes

Quais bots de IA estao visitando sites com mais frequencia em 2026?

Com base em 48 dias de dados de logs de servidor do wislr.com, os bots de IA com maior volume sao Meta-WebIndexer (1.833 requisicoes), ChatGPT-User (923 requisicoes), Claude-SearchBot (549 requisicoes), Applebot (495 requisicoes), PerplexityBot (456 requisicoes), OAI-SearchBot (330 requisicoes), ClaudeBot (206 requisicoes) e GPTBot (187 requisicoes). O ChatGPT-User apresentou o crescimento mais acentuado, com +201% entre fevereiro e marco de 2026.

Os bots de IA verificam o robots.txt antes de rastrear?

Varia bastante. O OAI-SearchBot verifica o robots.txt 3 a 6 vezes por dia, sem excecao. ClaudeBot e Claude-SearchBot verificam 4 vezes por dia em media. Bytespider e CCBot apenas verificam o robots.txt e nunca rastreiam nenhum conteudo real. No entanto, GPTBot e Meta-WebIndexer nunca verificam o robots.txt, apesar de estarem entre os crawlers mais ativos. O ChatGPT-User tambem nunca verifica o robots.txt.

Algum bot de IA solicita o llms.txt?

Nao. Em 12.099 requisicoes de bots ao longo de 48 dias, zero bots de IA solicitaram /llms.txt ou /llm.txt. O unico bot que verificou o llms.txt foi o Dataprovider.com, uma empresa de analitica web, nao uma plataforma de IA. Apesar da crescente discussao sobre o llms.txt como padrao, nenhum crawler de IA o procura atualmente na pratica.

Qual e a diferenca entre GPTBot e ChatGPT-User?

O GPTBot e o crawler de treinamento e indexacao da OpenAI que rastreia sistematicamente paginas, variantes de idioma e imagens em rajadas concentradas, frequentemente sem verificar o robots.txt. O ChatGPT-User e acionado quando uma pessoa real cola uma URL numa conversa do ChatGPT. O ChatGPT-User teve 584 IPs unicos para 923 requisicoes (quase 1:1), confirmando sessoes de usuarios individuais. O ChatGPT-User so busca texto HTML, nunca imagens, CSS ou JS. O GPTBot busca todos os tipos de ativos.

Como voce pode detectar trafego de bots de IA no seu site?

O trafego de bots de IA e invisivel para ferramentas de analitica do lado do cliente como o Google Analytics porque os bots nao executam JavaScript. Voce precisa de registro de requisicoes no lado do servidor que capture as requisicoes HTTP brutas que chegam ao seu dominio, incluindo o cabecalho User-Agent que identifica bots como GPTBot, ChatGPT-User, ClaudeBot e outros. O WISLR AI Visibility Dashboard fornece esse nivel de visibilidade de forma nativa.

Quais bots de IA rastreiam conteudo multilinguistico de forma mais agressiva?

O Meta-WebIndexer gasta 79,8% do seu orcamento de rastreamento em variantes de idioma, tornando-o o crawler multilinguistico mais agressivo. O GPTBot vem em seguida com 61,5%, rastreando todas as 11 versoes de idioma dos artigos. Bingbot (60,3%) e PerplexityBot (52,9%) tambem priorizam fortemente conteudo multilinguistico. O Googlebot e notavelmente menos multilinguistico, com apenas 10,4%. A baixa taxa de 4,7% do ChatGPT-User reflete que ele e impulsionado por usuarios humanos, nao por rastreamento automatizado.