← All Articles

El tráfico de bots de IA se está acelerando rápidamente. 48 días de registros de servidor revelan lo que hacen GPTBot, ChatGPT, ClaudeBot y otros 16.

Análisis del tráfico de bots de IA a partir de 48 días de registros de servidor que muestra GPTBot, ChatGPT-User, ClaudeBot y otros 16 bots

El tráfico de bots de IA ya no es un goteo

Entre febrero y mediados de marzo de 2026, la actividad de bots de IA en wislr.com no solo creció. Cambió de forma.

  • El tráfico de ChatGPT-User se multiplicó por 5 en siete semanas
  • GPTBot, completamente ausente hasta el 12 de marzo, ejecutó 187 solicitudes en una sola semana, 152 de ellas en una ráfaga de 3 minutos
    • GPTBot no es nuevo. Es el rastreador principal de entrenamiento de OpenAI, activo en toda la web durante años. Pero no parece rastrear todos los sitios de forma continua. Los datos sugieren que se activa en un sitio una vez que el contenido de ese sitio gana tracción en el ecosistema de OpenAI. Las referencias de ChatGPT-User a wislr.com ya se habían multiplicado por 5 antes de que GPTBot apareciera.
  • El volumen de OAI-SearchBot se multiplicó por 4
  • El 18 y 19 de marzo, tanto ClaudeBot como GPTBot comenzaron a solicitar sitemap.xml por primera vez, el mismo día, desde diferentes empresas

Eso es un cambio en la forma en que las plataformas de IA descubren e indexan contenido.


20 conclusiones para tu propio sitio web

  1. Google Analytics no puede ver nada de esto. Los bots de IA no ejecutan JavaScript. Si dependes de análisis del lado del cliente, tu tráfico de bots de IA es invisible. El registro del lado del servidor es la única forma de medirlo.
  2. Tu sitemap.xml acaba de volverse más importante. GPTBot y ClaudeBot comenzaron a consumir sitemaps en marzo de 2026 por primera vez. Si tu sitemap está desactualizado, incompleto o le faltan variantes de idioma, los rastreadores de IA perderán contenido.
  3. robots.txt no se respeta universalmente. GPTBot y Meta-WebIndexer nunca lo verifican. Si tu estrategia de contenido de IA depende de directivas de robots.txt, ten en cuenta que dos de los rastreadores más activos las ignoran por completo.
  4. El contenido multilingüe recibe una atención de rastreo desproporcionada. Bots como Meta-WebIndexer (80%), GPTBot (62%) y Bingbot (60%) dedican la mayor parte de su presupuesto a variantes de idioma. Si publicas contenido traducido, las plataformas de IA lo están indexando agresivamente.
  5. El tráfico de ChatGPT-User es una señal directa de citación de marca en conversaciones de IA. Cada solicitud representa una persona real pegando tu URL en ChatGPT. Esto es boca a boca medible, y está creciendo rápido.
  6. Los bots de IA rastrean en ráfagas, no en flujos constantes. GPTBot alcanzó 114 req/min en una ventana de 3 minutos. Si tu servidor no puede manejar tráfico en ráfagas, los rastreadores de IA pueden ser limitados o encontrar errores durante sus ejecuciones de indexación.
  7. OpenAI y Anthropic operan cada uno 3 bots separados. Uno para entrenamiento/indexación, uno para búsqueda, uno para sesiones de usuario en vivo. Bloquear uno no bloquea los demás. Tu robots.txt necesita directivas separadas para cada uno.
  8. OAI-SearchBot y Googlebot son los únicos bots que obtienen imágenes en volumen. Si las imágenes de tus artículos contienen contenido significativo (gráficos, diagramas, visualizaciones de datos), estos son los bots que las usarán en resultados de búsqueda.
  9. ChatGPT-User solo extrae texto. Cero imágenes, cero CSS, cero JS. Tu contenido HTML es lo que se incorpora a las conversaciones de IA. El texto estructurado y claro importa más que el diseño visual para la visibilidad en IA.
  10. Los rastreadores de IA alcanzan su pico a diferentes horas. GPTBot alcanza su máximo a las 04:00 UTC. Claude-SearchBot tiene su pico durante la noche. PerplexityBot hace ráfagas a las 23:00, 05:00 y 09:00. Si implementas cambios en el sitio durante horas fuera de pico en EE.UU., los bots de IA pueden ser los primeros en verlos.
  11. Meta es el rastreador de IA más agresivo por volumen. Meta-WebIndexer envió más solicitudes que cualquier otro bot en este conjunto de datos, con cero verificaciones de robots.txt. Si no estás rastreando los crawlers de Meta, te estás perdiendo al jugador más grande.
  12. La adopción de llms.txt sigue siendo teórica. Cero bots de IA solicitaron /llms.txt durante 48 días. Puede convertirse en un estándar eventualmente, pero ningún rastreador lo busca actualmente.
  13. Applebot renderiza tus páginas completamente. Obtiene CSS, JS e imágenes (47% de su tráfico). Si tu contenido requiere renderizado de JavaScript para estar completo, Applebot lo verá, pero la mayoría de los bots de IA no.
  14. El tráfico de ChatGPT-User está distribuido globalmente. 15 países, 584 IPs únicas. Tu contenido está siendo referenciado en conversaciones de IA en todo el mundo, no solo en EE.UU.
  15. El contenido técnico y tipo “cómo hacerlo” es el más referenciado en conversaciones de IA. Las páginas principales de ChatGPT-User fueron todas guías de implementación y explicaciones técnicas. El contenido profundo y específico gana citaciones de IA.
  16. Bytespider y CCBot solo verifican robots.txt y nunca rastrean. Están consumiendo tus directivas de robots.txt sin continuar después. Esto puede cambiar, pero actualmente generan sobrecarga de cumplimiento con cero indexación de contenido.
  17. El volumen de rastreo de IA puede cambiar de la noche a la mañana. GPTBot pasó de 0 a 187 solicitudes en una sola semana. Tus proyecciones de presupuesto de rastreo necesitan tener en cuenta cambios repentinos escalonados, no crecimiento gradual.
  18. El análisis de IPs revela la identidad del bot. La proporción casi 1:1 de IP por solicitud de ChatGPT-User demuestra sesiones de usuarios individuales. Las 2 IPs de GPTBot demuestran infraestructura centralizada. Los patrones de IP ayudan a distinguir las solicitudes reales activadas por usuarios del rastreo automatizado.
  19. Los eventos de rastreo coordinados ocurren entre familias de bots. GPTBot y OAI-SearchBot se dispararon simultáneamente el 19 de marzo desde la misma infraestructura de Microsoft. Cuando un bot de OpenAI se intensifica, espera que los demás lo sigan.
  20. Los bots que nunca has oído ya están visitando. PromptingBot, LinkupBot, Brightbot, Observer y otros están rastreando contenido activamente. El panorama de bots de IA es más amplio de lo que sugieren los nombres conocidos.

Los datos

Fuente: 288,566 archivos de registro de registros de solicitudes CDN en wislr.com
Período: 1 de febrero al 20 de marzo de 2026
Total de solicitudes: 71,603
Solicitudes de bots de IA/rastreadores analizadas: 12,099 (16.9% de todo el tráfico)

Cada solicitud HTTP a wislr.com pasa por un script CDN que captura los metadatos completos de la solicitud (agente de usuario, geolocalización, encabezados, temporización). Esto nos da la verdad de base sobre exactamente lo que están haciendo los bots de IA, con qué frecuencia y qué están leyendo.

¿Quieres este nivel de visibilidad sobre el tráfico de bots de IA en tu propio sitio?

Agenda una llamada

Clasificación de volumen de bots

Rango Bot Total de solicitudes Feb Mar (parcial) Tendencia
1 Meta-WebIndexer 1,833 707 1,126 +59%
2 Bingbot 1,221 547 674 +23%
3 ChatGPT-User 923 230 693 +201%
4 Googlebot 816 386 430 +11%
5 Claude-SearchBot 549 216 333 +54%
6 Applebot 495 257 238 -7%
7 PerplexityBot 456 244 212 -13%
8 OAI-SearchBot 330 117 213 +82%
9 ClaudeBot 206 69 137 +99%
10 GPTBot* 187 0 187 Nuevo en marzo
11 Amazonbot 71 27 44 +63%
12 Bytespider 68 33 35 +6%
13 Claude-User 18 6 12 +100%
14 CCBot 5 2 3 Mínimo
15 Meta-ExternalAgent 4 0 4 Nuevo
16 DuckAssistBot 4 0 4 Nuevo
17 Perplexity-User 3 3 0 Mínimo
18 YouBot 2 0 2 Nuevo
19 GoogleOther 2 1 1 Mínimo

*GPTBot no es un bot nuevo. Es el rastreador principal de entrenamiento de OpenAI, activo en toda la web durante años. “Nuevo en marzo” significa nuevo en este sitio. Los datos sugieren que GPTBot se activa en un sitio una vez que su contenido gana tracción en el ecosistema de OpenAI: las referencias de ChatGPT-User ya se habían multiplicado por 5 antes de que GPTBot apareciera.


Tendencias de volumen semanal

Bot Feb S1 Feb S2 Feb S3 Feb S4 Mar S1 Mar S2 Mar S3
GPTBot 0 0 0 0 0 4 183
ChatGPT-User 39 66 65 60 72 304 317
OAI-SearchBot 28 34 29 26 28 46 139
ClaudeBot 10 14 9 36 51 24 62
Claude-SearchBot 31 51 47 87 121 68 144
PerplexityBot 22 132 62 28 37 77 98
Bingbot 132 163 136 116 151 248 275
Meta-WebIndexer 63 35 271 338 396 541 189
Amazonbot 8 6 7 6 2 2 40

La semana 3 de marzo (15-20 de marzo) fue una semana de ruptura. GPTBot explotó de casi cero a 183 solicitudes. ChatGPT-User mantuvo más de 300/semana (5 veces su línea base de febrero). OAI-SearchBot alcanzó 139, un salto de 4 veces. Algo coordinado ocurrió en toda la flota de bots de OpenAI.


Perfiles individuales de bots


GPTBot (rastreador de entrenamiento/indexación de OpenAI)

Total: 187 solicitudes | Activo desde: 12 de marzo | IPs: 2 (altamente concentradas)

GPTBot no es un bot nuevo. OpenAI lo define como el rastreador utilizado para “hacer que nuestros modelos fundacionales de IA generativa sean más útiles y seguros”, rastreando contenido que puede utilizarse en el entrenamiento de sus modelos fundacionales. Ha estado operando en toda la web durante años. Lo notable aquí es que GPTBot estuvo completamente ausente de wislr.com hasta el 12 de marzo, y luego se activó con una ráfaga masiva de rastreo el 19 de marzo a las 04:38 UTC: 152 solicitudes en 3 minutos (pico de 114 req/min). Rastreó sistemáticamente cada artículo en cada variante de idioma.

Esto sugiere que GPTBot no rastrea todos los sitios de forma continua. Parece activarse e intensificarse en un sitio una vez que el contenido de ese sitio gana tracción en el ecosistema de OpenAI, ya que las referencias de ChatGPT-User a wislr.com ya se habían multiplicado por 5 antes de que GPTBot apareciera.

Lo que rastrea:

  • Artículos: 67% de las solicitudes
  • Variantes de idioma: 61.5%, rastreó las 11 versiones de idioma (de, fr, pl, hi, nl, uk, pt, ms, tr, it, es)
  • Imágenes: 28 solicitudes (encabezados de artículos, fotos de autor)
  • Sitemap.xml: 2 solicitudes (comenzó el 19 de marzo, comportamiento completamente nuevo)
  • robots.txt: Cero. Nunca lo verifica.

Temporización de rastreo: 81% de todas las solicitudes a las 04:00 UTC. Patrón de ráfaga extrema, casi todo el tráfico en una ventana de 3 minutos.

Infraestructura: Se ejecuta desde el ASN de Microsoft Limited, solo EE.UU. El 97.9% del tráfico proviene de una sola IP.

La ráfaga de GPTBot el 19 de marzo fue concurrente con una ráfaga de OAI-SearchBot desde la misma infraestructura de Microsoft: 50 req/min en la misma marca de tiempo. Esto parece coordinado.


OAI-SearchBot (rastreador de búsqueda de OpenAI)

Total: 330 solicitudes | Tendencia: +82% de febrero a marzo | IPs: 81

OAI-SearchBot es el rastreador de búsqueda dedicado de OpenAI, distinto de GPTBot. Es el verificador más persistente de robots.txt de cualquier bot de IA, consultándolo de 3 a 6 veces cada día sin excepción.

Lo que rastrea:

  • robots.txt: 54.5% de todo el tráfico (180 solicitudes, promedio de 3.8/día)
  • Artículos: 52 solicitudes
  • Imágenes: 55 solicitudes, descarga activamente imágenes de artículos, fotos de autor, capturas de pantalla de páginas
  • Página principal: 9 solicitudes

Temporización de rastreo: Distribuido a lo largo del día con picos leves a las 04:00 y 20:00 UTC.

Infraestructura: Microsoft Limited (87%) + Microsoft Corp (13%), solo EE.UU.

El único bot de OpenAI que respeta robots.txt (lo verifica obsesivamente). También el único bot de IA además de Googlebot que obtiene imágenes activamente en volumen, probablemente para tarjetas de resultados de búsqueda.


ChatGPT-User (obtención de sesiones de usuario en vivo)

Total: 923 solicitudes | Tendencia: +201% de febrero a marzo | IPs: 584

Esto no es un rastreador. Se activa cuando una persona real pega una URL de wislr.com en una conversación de ChatGPT. Las 584 IPs únicas (casi 1:1 con las solicitudes) confirman que son sesiones de usuarios individuales. Esta es la señal más clara de con qué frecuencia el contenido de wislr.com se cita en conversaciones de IA.

Contenido más referenciado:

Solicitudes Artículo
225 Shopify Same-Domain Checkout Analytics
112 Cloudflare Crawl Endpoint Pros and Cons
103 Cloudflare Crawl Best Settings
91 Cloudflare CDN Request Logging for Shopify
81 6 Core Tasks for Better 301 Redirects
50 AI Performance Metrics: Seven KPIs
37 Homepage
30 Essential Tools for Site Migrations
29 OpenAI KPIs and Success Metrics 2026
23 AEO Readiness Comparison

Lo que no obtiene: Cero imágenes, cero CSS, cero JS. Extracción pura de contenido HTML, solo quiere el texto.

Temporización de rastreo: Distribuido uniformemente en las 24 horas, sigue patrones de uso humano.

Distribución geográfica: EE.UU. (50%), Polonia (16%), Australia (5%), España (5%), Japón (5%), Brasil (4%), 15 países en total. Principales ciudades: Varsovia (149), Phoenix (145), San Antonio (126), Des Moines (91).


ClaudeBot (rastreador de entrenamiento/indexación de Anthropic)

Total: 206 solicitudes | Tendencia: +99% de febrero a marzo | IPs: 22

ClaudeBot está abrumadoramente enfocado en la verificación de cumplimiento: el 85% de su tráfico es robots.txt.

Lo que rastrea:

  • robots.txt: 175 solicitudes (85%), aumentó de 1-2/día a principios de febrero a 6-12/día en marzo
  • Sitemap.xml: 14 solicitudes, comenzó el 18 de marzo (nunca lo tocó antes)
  • Imágenes: 10 solicitudes (todas el 18 de marzo)
  • Páginas de contenido: muy pocas

ClaudeBot verifica robots.txt de forma más agresiva con el tiempo. Su repentino interés en sitemap.xml el 18 de marzo (5 solicitudes ese día, 8 el 19 de marzo) sugiere un nuevo despliegue de estrategia de rastreo por parte de Anthropic.

Infraestructura: ASN de Anthropic, PBC (97%), solo EE.UU.


Claude-SearchBot (rastreador de búsqueda web de Anthropic)

Total: 549 solicitudes | Tendencia: +54% de febrero a marzo | IPs: 8

Un bot de Anthropic separado, distinto de ClaudeBot y Claude-User. Este alimenta la función de búsqueda web de Claude. Más agresivo que ClaudeBot, realmente rastrea contenido.

Lo que rastrea:

  • robots.txt: 164 solicitudes (30%), diariamente, aumentando de 1-3 a 7-10/día
  • Sitemap.xml: 135 solicitudes, comenzó el 25 de febrero, rápidamente se convirtió en el segundo consumidor más activo de sitemaps después de Bingbot
  • Artículos: 142 solicitudes (26%)
  • Variantes de idioma: 23.3% del tráfico
  • Página principal: 45 solicitudes

Temporización de rastreo: Ponderado hacia la noche, picos a las 22:00, 01:00, 00:00 UTC.

En conjunto, Anthropic opera 3 bots distintos (ClaudeBot, Claude-SearchBot, Claude-User) con un total de 773 solicitudes, lo que convierte a Anthropic en la tercera presencia de bots de IA más grande después de Meta-WebIndexer y ChatGPT-User.


Claude-User (obtención de sesiones en vivo de Anthropic)

Total: 18 solicitudes | IPs: 8

El equivalente de Anthropic a ChatGPT-User. Se activa cuando alguien comparte una URL en una conversación de Claude. Volumen mucho menor que ChatGPT-User (18 vs 923).

Lo que rastrea: robots.txt (9), luego artículos sobre Cloudflare y un caso de estudio de un bufete de abogados.

Infraestructura: ASN de Google LLC (100%), solo EE.UU. Se ejecuta a través de Google Cloud, no de la propia infraestructura de Anthropic.


PerplexityBot (rastreador de indexación de Perplexity)

Total: 456 solicitudes | Tendencia: -13% de febrero a marzo | IPs: 13

Patrón de rastreo en ráfagas: 132 solicitudes en la semana 2 de febrero, baja a 28 en la semana 4, sube de nuevo a 98 en la semana 3 de marzo.

Lo que rastrea:

  • Artículos: 77% del tráfico, se enfoca fuertemente en contenido de métricas de rendimiento de IA
  • robots.txt: 71 solicitudes (estable 1-4/día)
  • Imágenes: 18 solicitudes (imágenes específicas de artículos)
  • Sitemap.xml: Cero. Nunca lo solicita.
  • Variantes de idioma: 52.9%, amplia cobertura multilingüe

Temporización de rastreo: Tres ventanas de ráfagas distintas a las 23:00, 05:00 y 09:00 UTC.

Infraestructura: Amazon Technologies Inc. (96%), solo EE.UU. 13 IPs, concentración moderada.


Googlebot

Total: 816 solicitudes | IPs: 72

Enfocado en la página principal (27% del tráfico) y el rastreador con el renderizado más completo. Obtiene imágenes, CSS, JS junto con el contenido.

Lo que rastrea:

  • Página principal: 220 solicitudes (27%)
  • Imágenes: 152 solicitudes
  • CSS: 132 solicitudes
  • JS: 54 solicitudes
  • Artículos: 141 solicitudes
  • robots.txt: 68 solicitudes
  • Sitemap.xml: 5 solicitudes (ocasional)

Variantes de idioma: Solo 10.4%, significativamente menos multilingüe que otros bots.

Infraestructura: Google LLC (91%), algunos desde Suecia (8%). Patrón de rastreo uniforme las 24 horas.


Bingbot

Total: 1,221 solicitudes | Tendencia: +23% de febrero a marzo | IPs: 258

El rastreador más consistente y amplio. También el consumidor dominante de sitemaps.

Lo que rastrea:

  • Artículos: 68% (con fuerte cobertura de variantes de idioma)
  • Sitemap.xml: 139 solicitudes (2-8/día, todos los días), con diferencia el rastreador de sitemaps más activo
  • Imágenes: 78 solicitudes (iconos sociales, PNGs de dashboard, imágenes de artículos)
  • robots.txt: 36 solicitudes

Variantes de idioma: 60.3%, fuerte enfoque en variantes en neerlandés (97) y alemán (98).

Temporización de rastreo: Cobertura uniforme las 24 horas, siempre activo.


Meta-WebIndexer

Total: 1,833 solicitudes | Tendencia: +59% de febrero a marzo | IPs: 156

El bot de mayor volumen en general. Abrumadoramente enfocado en contenido, especialmente variantes de idioma.

Lo que rastrea:

  • Artículos: 88% del tráfico
  • Variantes de idioma: 79.8%, el rastreador multilingüe más agresivo con diferencia
  • Sitemap.xml: 30 solicitudes
  • robots.txt: Cero. No verifica robots.txt en absoluto.

Temporización de rastreo: Fuerte en horas nocturnas/de madrugada, picos a las 20:00-21:00 y 00:00-01:00 UTC.

Infraestructura: ASN de Meta Platforms Ireland Ltd, solo EE.UU.

Al igual que GPTBot, Meta-WebIndexer no verifica robots.txt. A diferencia de GPTBot, ha estado consistentemente activo durante todo el período.


Patrones de comportamiento

Cumplimiento de robots.txt

Comportamiento Bots
Verificadores obsesivos (múltiples veces al día) OAI-SearchBot (3.8/día), ClaudeBot (4/día), Claude-SearchBot (4/día)
Verificadores regulares (diario o casi diario) PerplexityBot, Googlebot, Applebot, Amazonbot, FacebookExternalHit (exactamente 1/día como reloj)
Solo verifican robots.txt, nada más Bytespider (100%), CCBot (100%)
Nunca verifican robots.txt GPTBot, Meta-WebIndexer, ChatGPT-User

GPTBot y Meta-WebIndexer son los bots no conformes más notables. Rastrean agresivamente sin verificar nunca las reglas.

Descubrimiento de sitemap

Bot Solicitudes de sitemap Primera solicitud Patrón
Bingbot 139 1 de febrero Diario, 2-8/día (el rey del sitemap)
Claude-SearchBot 135 25 de febrero Intenso, se convirtió en el 2.° más activo
Meta-WebIndexer 30 5 de febrero Regular
ClaudeBot 14 18 de marzo Comportamiento completamente nuevo
Googlebot 5 2 de febrero Ocasional
GPTBot 2 19 de marzo Comportamiento completamente nuevo
Applebot 1 17 de marzo Una sola solicitud

El 18 y 19 de marzo marca un cambio. Tanto ClaudeBot como GPTBot comenzaron a solicitar sitemap.xml por primera vez, lo que sugiere nuevos despliegues de estrategia de rastreo de Anthropic y OpenAI simultáneamente.

Solicitudes de llms.txt / archivos específicos de IA

Ningún bot de IA solicita /llms.txt o /llm.txt. Cero solicitudes de GPTBot, ClaudeBot, PerplexityBot o cualquier otro rastreador de IA.

El único bot que verifica llms.txt es Dataprovider.com (una empresa de análisis web): 3 solicitudes entre febrero y marzo.

Dos solicitudes de /.well-known/ai-plugin.json provinieron de navegadores Firefox, no de bots.

Rastreo de variantes de idioma

Bot % del tráfico en variantes de idioma Cobertura
Meta-WebIndexer 79.8% Los 11 idiomas, distribuidos uniformemente
GPTBot 61.5% Los 11 idiomas, 8-12 cada uno
Bingbot 60.3% Los 11, fuerte en neerlandés/alemán
PerplexityBot 52.9% Los 11, alemán/español en primer lugar
Amazonbot 32.4% Los 11
Claude-SearchBot 23.3% Los 11, bastante uniforme
Applebot 23.0% Los 11
OAI-SearchBot 11.2% Los 11
Googlebot 10.4% Español/portugués en primer lugar
ChatGPT-User 4.7% Francés/español/italiano (impulsado por usuarios)

Meta-WebIndexer y GPTBot son los rastreadores multilingües más agresivos. El bajo porcentaje de ChatGPT-User tiene sentido: refleja en qué idiomas están leyendo los usuarios reales.

Rastreo de imágenes

Bot Solicitudes de imágenes Lo que obtienen
Googlebot 152 Iconos SVG, logos, favicons, recursos de renderizado
Google-InspectionTool 108 Iconos sociales, imágenes de casos de estudio
Googlebot-Image 75 Favicon, variantes de logo, imágenes de artículos
Bingbot 78 Iconos sociales, PNGs de dashboard, imágenes de artículos
OAI-SearchBot 55 Imágenes de artículos, fotos de autor, capturas de pantalla
Applebot 32 Imágenes de portada de artículos
GPTBot 28 Encabezados de artículos, fotos de autor (todas el 19 de marzo)
PerplexityBot 18 Imágenes de artículos
ClaudeBot 10 Foto de autor, capturas de pantalla (todas el 18 de marzo)
ChatGPT-User 0 Nunca obtiene imágenes

Googlebot obtiene imágenes para renderizado. OAI-SearchBot probablemente las obtiene para tarjetas de resultados de búsqueda. GPTBot y ClaudeBot realizaron ráfagas concentradas de imágenes en un solo día cada uno, lo que sugiere ejecuciones de indexación por lotes.

ChatGPT-User obtiene cero imágenes. Extracción pura de texto.

Otros bots notables descubiertos

PromptingBot/1.0.0 (104 solicitudes)

  • Se ejecuta en infraestructura de Google Cloud
  • Activo del 24 de febrero al 13 de marzo
  • Realiza renderizado completo de páginas (obtiene CSS, JS, imágenes, iconos sociales)
  • Se enfoca en contenido de métricas de rendimiento de IA

LinkupBot/1.0 (47 solicitudes)

  • De linkup.so, un servicio de indexación web
  • Infraestructura de Microsoft, origen: Francia
  • Verifica robots.txt, luego se enfoca en contenido de migraciones/redirecciones

Brightbot 1.0 (46 solicitudes)

  • De truview LLC, 41 IPs únicas
  • Se enfoca en variantes en idioma neerlandés

Observer/1.0 (36 solicitudes)

  • De obsrvr.net, infraestructura alemana/finlandesa
  • Solo rastrea robots.txt y un único artículo en francés

Dataprovider.com (148 solicitudes)

  • Empresa canadiense de análisis web
  • El único bot que verifica /llms.txt (3 veces)
  • También verifica /ads.txt y /humans.txt

Métodos HTTP

Todos los bots usan exclusivamente GET. Cero HEAD, POST u otros métodos en las 12,099 solicitudes de bots.


Datos de país/ASN

Bot ASN principal Países
GPTBot Microsoft Limited Solo EE.UU.
OAI-SearchBot Microsoft Limited (87%) + Microsoft Corp (13%) Solo EE.UU.
ChatGPT-User Microsoft Corporation (78%) EE.UU. (50%), Polonia (16%), Australia (5%), España (5%), Japón (5%), Brasil (4%), 15 países
ClaudeBot Anthropic, PBC (97%) Solo EE.UU.
Claude-SearchBot Anthropic, PBC (100%) Solo EE.UU.
Claude-User Google LLC (100%) Solo EE.UU.
PerplexityBot Amazon Technologies Inc. (96%) Solo EE.UU.
Amazonbot Amazon (100%) Solo EE.UU.
Applebot Apple Inc. (100%) Solo EE.UU.
Bingbot Microsoft Corporation (99.7%) Solo EE.UU.
Googlebot Google LLC (91%) EE.UU. (92%), Suecia (8%)
Meta-WebIndexer Meta Platforms Ireland Ltd (100%) Solo EE.UU.
Bytespider Amazon Singapore (53%), China Unicom (47%) Singapur (53%), China (47%)

Todos los bots de IA principales se ejecutan desde infraestructura de EE.UU. excepto Bytespider (Singapur/China). ChatGPT-User es el único bot con distribución verdaderamente global, lo que refleja su base de usuarios humanos.



Preguntas frecuentes

¿Cuáles son los bots de IA que visitan sitios web con más frecuencia en 2026?

Según 48 días de datos de registros de servidor de wislr.com, los bots de IA con mayor volumen son Meta-WebIndexer (1,833 solicitudes), ChatGPT-User (923 solicitudes), Claude-SearchBot (549 solicitudes), Applebot (495 solicitudes), PerplexityBot (456 solicitudes), OAI-SearchBot (330 solicitudes), ClaudeBot (206 solicitudes) y GPTBot (187 solicitudes). ChatGPT-User mostró el crecimiento más pronunciado con un +201% entre febrero y marzo de 2026.

¿Los bots de IA verifican robots.txt antes de rastrear?

Varía mucho. OAI-SearchBot verifica robots.txt de 3 a 6 veces al día sin excepción. ClaudeBot y Claude-SearchBot lo verifican 4 veces al día en promedio. Bytespider y CCBot solo verifican robots.txt y nunca rastrean contenido real. Sin embargo, GPTBot y Meta-WebIndexer nunca verifican robots.txt, a pesar de estar entre los rastreadores más activos. ChatGPT-User tampoco verifica robots.txt.

¿Algún bot de IA solicita llms.txt?

No. De 12,099 solicitudes de bots durante 48 días, cero bots de IA solicitaron /llms.txt o /llm.txt. El único bot que buscó llms.txt fue Dataprovider.com, una empresa de análisis web, no una plataforma de IA. A pesar de la creciente discusión sobre llms.txt como estándar, ningún rastreador de IA lo busca actualmente en la práctica.

¿Cuál es la diferencia entre GPTBot y ChatGPT-User?

GPTBot es el rastreador de entrenamiento e indexación de OpenAI que rastrea sistemáticamente páginas, variantes de idioma e imágenes en ráfagas concentradas, a menudo sin verificar robots.txt. ChatGPT-User se activa cuando una persona real pega una URL en una conversación de ChatGPT. ChatGPT-User tenía 584 IPs únicas para 923 solicitudes (casi 1:1), lo que confirma sesiones de usuarios individuales. ChatGPT-User solo obtiene texto HTML, nunca imágenes, CSS o JS. GPTBot obtiene todos los tipos de recursos.

¿Cómo se puede detectar el tráfico de bots de IA en tu sitio web?

El tráfico de bots de IA es invisible para las herramientas de análisis del lado del cliente como Google Analytics porque los bots no ejecutan JavaScript. Necesitas registro de solicitudes del lado del servidor que capture las solicitudes HTTP sin procesar que llegan a tu dominio, incluido el encabezado User-Agent que identifica bots como GPTBot, ChatGPT-User, ClaudeBot y otros. El WISLR AI Visibility Dashboard proporciona este nivel de visibilidad de forma nativa.

¿Cuáles son los bots de IA que rastrean contenido multilingüe de forma más agresiva?

Meta-WebIndexer dedica el 79.8% de su presupuesto de rastreo a variantes de idioma, lo que lo convierte en el rastreador multilingüe más agresivo. GPTBot le sigue con el 61.5%, rastreando las 11 versiones de idioma de los artículos. Bingbot (60.3%) y PerplexityBot (52.9%) también se enfocan fuertemente en contenido multilingüe. Googlebot es notablemente menos multilingüe con solo el 10.4%. La baja tasa del 4.7% de ChatGPT-User refleja que es impulsado por usuarios humanos, no por rastreo automatizado.