← All Articles

Il traffico dei bot AI sta accelerando rapidamente. 48 giorni di log del server rivelano cosa stanno facendo GPTBot, ChatGPT, ClaudeBot e altri 16.

Analisi del traffico dei bot AI da 48 giorni di log del server che mostra GPTBot, ChatGPT-User, ClaudeBot e altri 16 bot

Il traffico dei bot AI non è più un rivolo

Tra febbraio e metà marzo 2026, l’attività dei bot AI su wislr.com non è solo cresciuta. Ha cambiato forma.

  • Il traffico di ChatGPT-User è quintuplicato in sette settimane
  • GPTBot, completamente assente fino al 12 marzo, ha eseguito 187 richieste in una sola settimana, 152 delle quali in un burst di 3 minuti
    • GPTBot non è un bot nuovo. È il crawler di addestramento principale di OpenAI, attivo sul web da anni. Ma non sembra eseguire il crawl di ogni sito in modo continuo. I dati suggeriscono che si attiva su un sito una volta che i contenuti di quel sito guadagnano trazione nell’ecosistema di OpenAI. I referral di ChatGPT-User verso wislr.com erano già quintuplicati prima che GPTBot si presentasse.
  • Il volume di OAI-SearchBot è quadruplicato
  • Il 18-19 marzo, sia ClaudeBot che GPTBot hanno iniziato a richiedere sitemap.xml per la prima volta, nello stesso giorno, da aziende diverse

Questo è un cambiamento nel modo in cui le piattaforme AI scoprono e indicizzano i contenuti.


20 conclusioni per il tuo sito web

  1. Google Analytics non può vedere nulla di tutto questo. I bot AI non eseguono JavaScript. Se ti affidi agli analytics lato client, il traffico dei bot AI è invisibile. Il logging lato server è l’unico modo per misurarlo.
  2. Il tuo sitemap.xml è appena diventato più importante. GPTBot e ClaudeBot hanno entrambi iniziato a consumare le sitemap a marzo 2026 per la prima volta. Se la tua sitemap è obsoleta, incompleta o priva di varianti linguistiche, i crawler AI perderanno contenuti.
  3. robots.txt non è universalmente rispettato. GPTBot e Meta-WebIndexer non lo controllano mai. Se la tua strategia di contenuti AI dipende dalle direttive robots.txt, sappi che due dei crawler più attivi le ignorano completamente.
  4. I contenuti multilingue ricevono un’attenzione di crawl sproporzionata. Bot come Meta-WebIndexer (80%), GPTBot (62%) e Bingbot (60%) dedicano la maggior parte del loro budget alle varianti linguistiche. Se pubblichi contenuti tradotti, le piattaforme AI li stanno indicizzando in modo aggressivo.
  5. Il traffico di ChatGPT-User è un segnale diretto di citazione del brand nelle conversazioni AI. Ogni richiesta rappresenta una persona reale che incolla il tuo URL in ChatGPT. Si tratta di passaparola misurabile, e sta crescendo rapidamente.
  6. I bot AI eseguono il crawl a burst, non in flussi costanti. GPTBot ha raggiunto 114 req/min in una finestra di 3 minuti. Se il tuo server non può gestire il traffico a burst, i crawler AI potrebbero essere limitati o incontrare errori durante le loro sessioni di indicizzazione.
  7. OpenAI e Anthropic operano ciascuno con 3 bot separati. Uno per addestramento/indicizzazione, uno per la ricerca, uno per le sessioni utente live. Bloccarne uno non blocca gli altri. Il tuo robots.txt ha bisogno di direttive separate per ciascuno.
  8. OAI-SearchBot e Googlebot sono gli unici bot che recuperano immagini in volume. Se le immagini dei tuoi articoli contengono informazioni significative (grafici, diagrammi, visualizzazioni dati), questi sono i bot che le utilizzeranno nei risultati di ricerca.
  9. ChatGPT-User estrae solo testo. Zero immagini, zero CSS, zero JS. Il contenuto HTML è ciò che viene estratto nelle conversazioni AI. Per la visibilità AI conta più un testo strutturato e chiaro del design visivo.
  10. I crawler AI raggiungono i picchi in orari diversi. GPTBot colpisce alle 04:00 UTC. Claude-SearchBot raggiunge il picco di notte. PerplexityBot ha burst alle 23:00, 05:00 e 09:00. Se distribuisci modifiche al sito durante le ore non di punta negli USA, i bot AI potrebbero essere i primi a vederle.
  11. Meta è il crawler AI più aggressivo per volume. Meta-WebIndexer ha inviato più richieste di qualsiasi altro bot in questo dataset, con zero controlli robots.txt. Se non stai tracciando i crawler di Meta, ti stai perdendo il player più grande.
  12. L’adozione di llms.txt è ancora teorica. Zero bot AI hanno richiesto /llms.txt in 48 giorni. Potrebbe diventare uno standard in futuro, ma nessun crawler lo cerca attualmente.
  13. Applebot renderizza completamente le tue pagine. Recupera CSS, JS e immagini (47% del suo traffico). Se il tuo contenuto richiede il rendering JavaScript per essere completo, Applebot lo vedrà, ma la maggior parte dei bot AI no.
  14. Il traffico di ChatGPT-User è distribuito globalmente. 15 paesi, 584 IP unici. I tuoi contenuti vengono citati nelle conversazioni AI in tutto il mondo, non solo negli USA.
  15. I contenuti tecnici e le guide pratiche sono quelli più citati nelle conversazioni AI. Le pagine più consultate da ChatGPT-User erano tutte guide all’implementazione e articoli tecnici esplicativi. I contenuti approfonditi e specifici guadagnano citazioni AI.
  16. Bytespider e CCBot controllano solo robots.txt e non eseguono mai il crawl. Stanno consumando le tue direttive robots.txt senza procedere oltre. Questo potrebbe cambiare, ma attualmente generano overhead di conformità con zero indicizzazione di contenuti.
  17. Il volume di crawl AI può cambiare da un giorno all’altro. GPTBot è passato da 0 a 187 richieste in una sola settimana. Le tue proiezioni di budget di crawl devono tenere conto di cambiamenti improvvisi a gradino, non di crescita graduale.
  18. L’analisi degli IP rivela l’identità dei bot. Il rapporto IP-richieste quasi 1:1 di ChatGPT-User dimostra sessioni utente individuali. I 2 IP di GPTBot dimostrano infrastruttura centralizzata. I pattern degli IP aiutano a distinguere i fetch generati da utenti reali dal crawling automatizzato.
  19. Si verificano eventi di crawl coordinati tra famiglie di bot. GPTBot e OAI-SearchBot si sono attivati simultaneamente il 19 marzo dalla stessa infrastruttura Microsoft. Quando un bot OpenAI accelera, aspettati che gli altri seguano.
  20. I bot di cui non hai mai sentito parlare stanno già visitando il tuo sito. PromptingBot, LinkupBot, Brightbot, Observer e altri stanno attivamente eseguendo il crawl dei contenuti. Il panorama dei bot AI è più ampio di quanto suggeriscano i nomi più conosciuti.

I dati

Fonte: 288.566 file di log dal logging delle richieste CDN script su wislr.com
Periodo: 1 febbraio - 20 marzo 2026
Totale richieste: 71.603
Richieste di bot AI/crawler analizzate: 12.099 (16,9% di tutto il traffico)

Ogni richiesta HTTP a wislr.com passa attraverso uno script CDN che cattura i metadati completi della richiesta (user agent, geo, header, timing). Questo ci fornisce dati certi su cosa stanno facendo esattamente i bot AI, con quale frequenza e cosa stanno leggendo.

Vuoi questo livello di visibilità sul traffico dei bot AI del tuo sito?

Prenota una chiamata

Classifica dei bot per volume

Rank Bot Totale hit Feb Mar (parziale) Trend
1 Meta-WebIndexer 1.833 707 1.126 +59%
2 Bingbot 1.221 547 674 +23%
3 ChatGPT-User 923 230 693 +201%
4 Googlebot 816 386 430 +11%
5 Claude-SearchBot 549 216 333 +54%
6 Applebot 495 257 238 -7%
7 PerplexityBot 456 244 212 -13%
8 OAI-SearchBot 330 117 213 +82%
9 ClaudeBot 206 69 137 +99%
10 GPTBot* 187 0 187 Nuovo a marzo
11 Amazonbot 71 27 44 +63%
12 Bytespider 68 33 35 +6%
13 Claude-User 18 6 12 +100%
14 CCBot 5 2 3 Minimo
15 Meta-ExternalAgent 4 0 4 Nuovo
16 DuckAssistBot 4 0 4 Nuovo
17 Perplexity-User 3 3 0 Minimo
18 YouBot 2 0 2 Nuovo
19 GoogleOther 2 1 1 Minimo

*GPTBot non è un bot nuovo. È il crawler di addestramento principale di OpenAI, attivo sul web da anni. “Nuovo a marzo” significa nuovo su questo sito. I dati suggeriscono che GPTBot si attiva su un sito una volta che i suoi contenuti guadagnano trazione nell’ecosistema di OpenAI: i referral di ChatGPT-User erano già quintuplicati prima che GPTBot apparisse.


Trend di volume settimanali

Bot Feb S1 Feb S2 Feb S3 Feb S4 Mar S1 Mar S2 Mar S3
GPTBot 0 0 0 0 0 4 183
ChatGPT-User 39 66 65 60 72 304 317
OAI-SearchBot 28 34 29 26 28 46 139
ClaudeBot 10 14 9 36 51 24 62
Claude-SearchBot 31 51 47 87 121 68 144
PerplexityBot 22 132 62 28 37 77 98
Bingbot 132 163 136 116 151 248 275
Meta-WebIndexer 63 35 271 338 396 541 189
Amazonbot 8 6 7 6 2 2 40

Marzo S3 (15-20 marzo) è stata la settimana di svolta. GPTBot è esploso da quasi zero a 183 richieste. ChatGPT-User ha mantenuto oltre 300 richieste/settimana (5x rispetto al livello di febbraio). OAI-SearchBot ha raggiunto 139, un aumento di 4x. Qualcosa di coordinato è successo nell’intera flotta di bot di OpenAI.


Profili dei singoli bot


GPTBot (crawler di addestramento/indicizzazione di OpenAI)

Totale: 187 richieste | Attivo dal: 12 marzo | IP: 2 (altamente concentrati)

GPTBot non è un bot nuovo. OpenAI lo definisce come il crawler utilizzato per “rendere i nostri modelli fondazionali di AI generativa più utili e sicuri”, eseguendo il crawl di contenuti che possono essere usati nell’addestramento dei loro modelli fondazionali. Opera sul web da anni. Ciò che è notevole è che GPTBot era completamente assente da wislr.com fino al 12 marzo, poi si è attivato con un massiccio burst di crawl il 19 marzo alle 04:38 UTC: 152 richieste in 3 minuti (picco di 114 req/min). Ha sistematicamente eseguito il crawl di ogni articolo in ogni variante linguistica.

Questo suggerisce che GPTBot non esegue il crawl di ogni sito in modo continuo. Sembra attivarsi e accelerare su un sito una volta che i contenuti di quel sito guadagnano trazione nell’ecosistema di OpenAI, dato che i referral di ChatGPT-User verso wislr.com erano già quintuplicati prima che GPTBot si presentasse.

Cosa esegue il crawl:

  • Articoli: 67% delle richieste
  • Varianti linguistiche: 61,5%, crawl di tutte le 11 versioni linguistiche (de, fr, pl, hi, nl, uk, pt, ms, tr, it, es)
  • Immagini: 28 richieste (header degli articoli, foto autore)
  • Sitemap.xml: 2 richieste (iniziate il 19 marzo, comportamento del tutto nuovo)
  • robots.txt: Zero. Non lo controlla mai.

Timing del crawl: 81% di tutte le richieste alle 04:00 UTC. Pattern a burst estremo, quasi tutto il traffico in una singola finestra di 3 minuti.

Infrastruttura: Opera dal ASN Microsoft Limited, solo USA. 97,9% del traffico da un singolo IP.

Il burst di GPTBot del 19 marzo è stato contemporaneo a un burst di OAI-SearchBot dalla stessa infrastruttura Microsoft: 50 req/min allo stesso timestamp. Questo appare coordinato.


OAI-SearchBot (crawler di ricerca di OpenAI)

Totale: 330 richieste | Trend: +82% da febbraio a marzo | IP: 81

OAI-SearchBot è il crawler di ricerca dedicato di OpenAI, distinto da GPTBot. È il controllore di robots.txt più persistente tra tutti i bot AI, verificandolo 3-6 volte ogni singolo giorno senza eccezioni.

Cosa esegue il crawl:

  • robots.txt: 54,5% di tutto il traffico (180 hit, media di 3,8/giorno)
  • Articoli: 52 richieste
  • Immagini: 55 richieste, scarica attivamente immagini degli articoli, foto autore, screenshot delle pagine
  • Homepage: 9 richieste

Timing del crawl: Distribuito nell’arco della giornata con lievi picchi alle 04:00 e 20:00 UTC.

Infrastruttura: Microsoft Limited (87%) + Microsoft Corp (13%), solo USA.

L’unico bot OpenAI che rispetta robots.txt (lo controlla in modo ossessivo). Anche l’unico bot AI oltre a Googlebot che recupera attivamente immagini in volume, probabilmente per le card dei risultati di ricerca.


ChatGPT-User (fetcher per sessioni utente live)

Totale: 923 richieste | Trend: +201% da febbraio a marzo | IP: 584

Questo non è un crawler. Si attiva quando una persona reale incolla un URL di wislr.com in una conversazione ChatGPT. I 584 IP unici (quasi 1:1 con le richieste) confermano che si tratta di sessioni utente individuali. Questo è il segnale più chiaro di quanto spesso i contenuti di wislr.com vengono citati nelle conversazioni AI.

Contenuti più referenziati:

Hit Articolo
225 Shopify Same-Domain Checkout Analytics
112 Cloudflare Crawl Endpoint Pros and Cons
103 Cloudflare Crawl Best Settings
91 Cloudflare CDN Request Logging for Shopify
81 6 Core Tasks for Better 301 Redirects
50 AI Performance Metrics: Seven KPIs
37 Homepage
30 Essential Tools for Site Migrations
29 OpenAI KPIs and Success Metrics 2026
23 AEO Readiness Comparison

Cosa non recupera: Zero immagini, zero CSS, zero JS. Pura estrazione di contenuto HTML, vuole solo il testo.

Timing del crawl: Distribuito uniformemente su tutte le 24 ore, segue i pattern di utilizzo umano.

Distribuzione geografica: USA (50%), Polonia (16%), Australia (5%), Spagna (5%), Giappone (5%), Brasile (4%), 15 paesi in totale. Principali città: Varsavia (149), Phoenix (145), San Antonio (126), Des Moines (91).


ClaudeBot (crawler di addestramento/indicizzazione di Anthropic)

Totale: 206 richieste | Trend: +99% da febbraio a marzo | IP: 22

ClaudeBot è prevalentemente focalizzato sul controllo di conformità: l'85% del suo traffico è robots.txt.

Cosa esegue il crawl:

  • robots.txt: 175 richieste (85%), aumentate da 1-2/giorno a inizio febbraio a 6-12/giorno entro marzo
  • Sitemap.xml: 14 richieste, iniziate il 18 marzo (non lo aveva mai toccato prima)
  • Immagini: 10 richieste (tutte il 18 marzo)
  • Pagine di contenuto: pochissime

ClaudeBot controlla robots.txt in modo sempre più aggressivo nel tempo. Il suo improvviso interesse per sitemap.xml il 18 marzo (5 hit quel giorno, 8 il 19 marzo) suggerisce un nuovo rollout della strategia di crawl da parte di Anthropic.

Infrastruttura: ASN Anthropic, PBC (97%), solo USA.


Claude-SearchBot (crawler di ricerca web di Anthropic)

Totale: 549 richieste | Trend: +54% da febbraio a marzo | IP: 8

Un bot Anthropic separato, distinto da ClaudeBot e Claude-User. Alimenta la funzione di ricerca web di Claude. Più aggressivo di ClaudeBot, esegue effettivamente il crawl dei contenuti.

Cosa esegue il crawl:

  • robots.txt: 164 richieste (30%), giornaliere, in aumento da 1-3 a 7-10/giorno
  • Sitemap.xml: 135 richieste, iniziate il 25 febbraio, rapidamente diventato il secondo consumatore di sitemap più attivo dopo Bingbot
  • Articoli: 142 richieste (26%)
  • Varianti linguistiche: 23,3% del traffico
  • Homepage: 45 richieste

Timing del crawl: Concentrato nelle ore notturne, picchi alle 22:00, 01:00, 00:00 UTC.

Complessivamente, Anthropic opera con 3 bot distinti (ClaudeBot, Claude-SearchBot, Claude-User) per un totale di 773 richieste, rendendo Anthropic la terza più grande presenza di bot AI dopo Meta-WebIndexer e ChatGPT-User.


Claude-User (fetcher per sessioni live di Anthropic)

Totale: 18 richieste | IP: 8

L’equivalente Anthropic di ChatGPT-User. Si attiva quando qualcuno condivide un URL in una conversazione Claude. Volume molto più basso rispetto a ChatGPT-User (18 contro 923).

Cosa esegue il crawl: robots.txt (9), poi articoli su Cloudflare e un caso studio di uno studio legale.

Infrastruttura: ASN Google LLC (100%), solo USA. Opera tramite Google Cloud, non sull’infrastruttura propria di Anthropic.


PerplexityBot (crawler di indicizzazione di Perplexity)

Totale: 456 richieste | Trend: -13% da febbraio a marzo | IP: 13

Pattern di crawl a burst: 132 richieste nella S2 di febbraio, calo a 28 nella S4, risalita a 98 nella S3 di marzo.

Cosa esegue il crawl:

  • Articoli: 77% del traffico, punta fortemente ai contenuti sulle metriche di performance AI
  • robots.txt: 71 richieste (costante 1-4/giorno)
  • Immagini: 18 richieste (immagini specifiche degli articoli)
  • Sitemap.xml: Zero. Non lo richiede mai.
  • Varianti linguistiche: 52,9%, ampia copertura multilingue

Timing del crawl: Tre finestre di burst distinte alle 23:00, 05:00 e 09:00 UTC.

Infrastruttura: Amazon Technologies Inc. (96%), solo USA. 13 IP, concentrazione moderata.


Googlebot

Totale: 816 richieste | IP: 72

Focalizzato sulla homepage (27% del traffico) e il crawler più orientato al “rendering completo”. Recupera immagini, CSS, JS insieme ai contenuti.

Cosa esegue il crawl:

  • Homepage: 220 richieste (27%)
  • Immagini: 152 richieste
  • CSS: 132 richieste
  • JS: 54 richieste
  • Articoli: 141 richieste
  • robots.txt: 68 richieste
  • Sitemap.xml: 5 richieste (occasionali)

Varianti linguistiche: Solo 10,4%, significativamente meno multilingue degli altri bot.

Infrastruttura: Google LLC (91%), alcuni dalla Svezia (8%). Pattern di crawl uniforme sulle 24 ore.


Bingbot

Totale: 1.221 richieste | Trend: +23% da febbraio a marzo | IP: 258

Il crawler più costante e ad ampio raggio. Anche il principale consumatore di sitemap.

Cosa esegue il crawl:

  • Articoli: 68% (con forte copertura delle varianti linguistiche)
  • Sitemap.xml: 139 richieste (2-8/giorno, ogni giorno), di gran lunga il crawler di sitemap più attivo
  • Immagini: 78 richieste (icone social, PNG della dashboard, immagini degli articoli)
  • robots.txt: 36 richieste

Varianti linguistiche: 60,3%, forte focus sulle varianti olandese (97) e tedesca (98).

Timing del crawl: Copertura uniforme sulle 24 ore, sempre attivo.


Meta-WebIndexer

Totale: 1.833 richieste | Trend: +59% da febbraio a marzo | IP: 156

Il bot con il volume più alto in assoluto. Prevalentemente focalizzato sui contenuti, specialmente le varianti linguistiche.

Cosa esegue il crawl:

  • Articoli: 88% del traffico
  • Varianti linguistiche: 79,8%, di gran lunga il crawler multilingue più aggressivo
  • Sitemap.xml: 30 richieste
  • robots.txt: Zero. Non controlla affatto robots.txt.

Timing del crawl: Concentrato in serata/notte, picchi alle 20:00-21:00 e 00:00-01:00 UTC.

Infrastruttura: ASN Meta Platforms Ireland Ltd, solo USA.

Come GPTBot, Meta-WebIndexer non controlla robots.txt. A differenza di GPTBot, è stato attivo in modo costante durante l’intero periodo.


Pattern comportamentali

Conformità a robots.txt

Comportamento Bot
Controllori ossessivi (più volte al giorno) OAI-SearchBot (3,8/giorno), ClaudeBot (4/giorno), Claude-SearchBot (4/giorno)
Controllori regolari (giornalieri o quasi) PerplexityBot, Googlebot, Applebot, Amazonbot, FacebookExternalHit (esattamente 1/giorno come un orologio)
Controllano solo robots.txt, nient’altro Bytespider (100%), CCBot (100%)
Non controllano mai robots.txt GPTBot, Meta-WebIndexer, ChatGPT-User

GPTBot e Meta-WebIndexer sono i bot non conformi più notevoli. Eseguono il crawl in modo aggressivo senza mai verificare le regole.

Scoperta della sitemap

Bot Hit sitemap Prima richiesta Pattern
Bingbot 139 1 feb Giornaliero, 2-8/giorno (il re delle sitemap)
Claude-SearchBot 135 25 feb Intenso, diventato il 2° più attivo
Meta-WebIndexer 30 5 feb Regolare
ClaudeBot 14 18 mar Comportamento del tutto nuovo
Googlebot 5 2 feb Occasionale
GPTBot 2 19 mar Comportamento del tutto nuovo
Applebot 1 17 mar Singolo hit

Il 18-19 marzo segna un cambiamento. Sia ClaudeBot che GPTBot hanno iniziato a richiedere sitemap.xml per la prima volta, suggerendo nuovi rollout della strategia di crawl da parte di Anthropic e OpenAI simultaneamente.

Richieste di llms.txt / file specifici per l’AI

Nessun bot AI richiede /llms.txt o /llm.txt. Zero hit da GPTBot, ClaudeBot, PerplexityBot o qualsiasi altro crawler AI.

L’unico bot che verifica llms.txt è Dataprovider.com (un’azienda di web analytics): 3 richieste tra febbraio e marzo.

Due richieste per /.well-known/ai-plugin.json sono arrivate da browser Firefox, non da bot.

Crawl delle varianti linguistiche

Bot % del traffico nelle varianti linguistiche Copertura
Meta-WebIndexer 79,8% Tutte le 11 lingue, distribuzione uniforme
GPTBot 61,5% Tutte le 11 lingue, 8-12 ciascuna
Bingbot 60,3% Tutte le 11, forte su olandese/tedesco
PerplexityBot 52,9% Tutte le 11, tedesco/spagnolo in testa
Amazonbot 32,4% Tutte le 11
Claude-SearchBot 23,3% Tutte le 11, abbastanza uniforme
Applebot 23,0% Tutte le 11
OAI-SearchBot 11,2% Tutte le 11
Googlebot 10,4% Spagnolo/portoghese in testa
ChatGPT-User 4,7% Francese/spagnolo/italiano (guidato dagli utenti)

Meta-WebIndexer e GPTBot sono i crawler multilingue più aggressivi. La bassa percentuale di ChatGPT-User ha senso: riflette in quali lingue leggono gli utenti reali.

Crawl delle immagini

Bot Richieste immagini Cosa recuperano
Googlebot 152 Icone SVG, loghi, favicon, risorse di rendering
Google-InspectionTool 108 Icone social, immagini dei case study
Googlebot-Image 75 Favicon, varianti del logo, immagini degli articoli
Bingbot 78 Icone social, PNG della dashboard, immagini degli articoli
OAI-SearchBot 55 Immagini degli articoli, foto autore, screenshot
Applebot 32 Immagini di copertina degli articoli
GPTBot 28 Header degli articoli, foto autore (tutti il 19 marzo)
PerplexityBot 18 Immagini degli articoli
ClaudeBot 10 Foto autore, screenshot (tutti il 18 marzo)
ChatGPT-User 0 Non recupera mai immagini

Googlebot recupera immagini per il rendering. OAI-SearchBot probabilmente le recupera per le card dei risultati di ricerca. GPTBot e ClaudeBot hanno entrambi eseguito burst concentrati di immagini in un singolo giorno ciascuno, suggerendo sessioni di indicizzazione batch.

ChatGPT-User recupera zero immagini. Pura estrazione di testo.

Altri bot notevoli scoperti

PromptingBot/1.0.0 (104 richieste)

  • Opera su infrastruttura Google Cloud
  • Attivo dal 24 febbraio al 13 marzo
  • Esegue rendering completo delle pagine (recupera CSS, JS, immagini, icone social)
  • Punta ai contenuti sulle metriche di performance AI

LinkupBot/1.0 (47 richieste)

  • Da linkup.so, un servizio di indicizzazione web
  • Infrastruttura Microsoft, origine: Francia
  • Controlla robots.txt, poi si concentra su contenuti di migrazione/redirect

Brightbot 1.0 (46 richieste)

  • Da truview LLC, 41 IP unici
  • Si concentra sulle varianti in lingua olandese

Observer/1.0 (36 richieste)

  • Da obsrvr.net, infrastruttura tedesca/finlandese
  • Esegue il crawl solo di robots.txt e di un singolo articolo in francese

Dataprovider.com (148 richieste)

  • Azienda canadese di web analytics
  • L’unico bot che verifica /llms.txt (3 volte)
  • Controlla anche /ads.txt e /humans.txt

Metodi HTTP

Ogni singolo bot utilizza esclusivamente GET. Zero HEAD, POST o altri metodi su tutte le 12.099 richieste dei bot.


Dati su paese/ASN

Bot ASN primario Paesi
GPTBot Microsoft Limited Solo USA
OAI-SearchBot Microsoft Limited (87%) + Microsoft Corp (13%) Solo USA
ChatGPT-User Microsoft Corporation (78%) USA (50%), Polonia (16%), Australia (5%), Spagna (5%), Giappone (5%), Brasile (4%), 15 paesi
ClaudeBot Anthropic, PBC (97%) Solo USA
Claude-SearchBot Anthropic, PBC (100%) Solo USA
Claude-User Google LLC (100%) Solo USA
PerplexityBot Amazon Technologies Inc. (96%) Solo USA
Amazonbot Amazon (100%) Solo USA
Applebot Apple Inc. (100%) Solo USA
Bingbot Microsoft Corporation (99,7%) Solo USA
Googlebot Google LLC (91%) USA (92%), Svezia (8%)
Meta-WebIndexer Meta Platforms Ireland Ltd (100%) Solo USA
Bytespider Amazon Singapore (53%), China Unicom (47%) Singapore (53%), Cina (47%)

Tutti i principali bot AI operano da infrastruttura USA ad eccezione di Bytespider (Singapore/Cina). ChatGPT-User è l’unico bot con una distribuzione veramente globale, che riflette la sua base di utenti umani.



Domande frequenti

Quali bot AI visitano i siti web più frequentemente nel 2026?

Sulla base di 48 giorni di dati dai log del server di wislr.com, i bot AI con il volume più alto sono Meta-WebIndexer (1.833 richieste), ChatGPT-User (923 richieste), Claude-SearchBot (549 richieste), Applebot (495 richieste), PerplexityBot (456 richieste), OAI-SearchBot (330 richieste), ClaudeBot (206 richieste) e GPTBot (187 richieste). ChatGPT-User ha mostrato la crescita più rapida con +201% tra febbraio e marzo 2026.

I bot AI controllano robots.txt prima del crawling?

Varia molto. OAI-SearchBot controlla robots.txt 3-6 volte al giorno senza eccezioni. ClaudeBot e Claude-SearchBot lo controllano in media 4 volte al giorno. Bytespider e CCBot controllano solo robots.txt e non eseguono mai il crawl di alcun contenuto effettivo. Tuttavia, GPTBot e Meta-WebIndexer non controllano mai robots.txt, nonostante siano tra i crawler più attivi. Anche ChatGPT-User non controlla mai robots.txt.

Qualche bot AI richiede llms.txt?

No. Su 12.099 richieste di bot in 48 giorni, zero bot AI hanno richiesto /llms.txt o /llm.txt. L’unico bot che ha verificato llms.txt è stato Dataprovider.com, un’azienda di web analytics, non una piattaforma AI. Nonostante la crescente discussione su llms.txt come standard, nessun crawler AI lo cerca attualmente nella pratica.

Qual è la differenza tra GPTBot e ChatGPT-User?

GPTBot è il crawler di addestramento e indicizzazione di OpenAI che esegue sistematicamente il crawl di pagine, varianti linguistiche e immagini in burst concentrati, spesso senza controllare robots.txt. ChatGPT-User si attiva quando una persona reale incolla un URL in una conversazione ChatGPT. ChatGPT-User ha avuto 584 IP unici per 923 richieste (quasi 1:1), confermando sessioni utente individuali. ChatGPT-User recupera solo testo HTML, mai immagini, CSS o JS. GPTBot recupera tutti i tipi di risorse.

Come si può rilevare il traffico dei bot AI sul proprio sito web?

Il traffico dei bot AI è invisibile agli strumenti di analytics lato client come Google Analytics perché i bot non eseguono JavaScript. Serve un logging delle richieste lato server che catturi le richieste HTTP raw che arrivano al tuo dominio, incluso l’header User-Agent che identifica bot come GPTBot, ChatGPT-User, ClaudeBot e altri. La WISLR AI Visibility Dashboard fornisce questo livello di visibilità fin da subito.

Quali bot AI eseguono il crawl dei contenuti multilingue in modo più aggressivo?

Meta-WebIndexer dedica il 79,8% del proprio budget di crawl alle varianti linguistiche, rendendolo il crawler multilingue più aggressivo. GPTBot segue al 61,5%, eseguendo il crawl di tutte le 11 versioni linguistiche degli articoli. Anche Bingbot (60,3%) e PerplexityBot (52,9%) puntano pesantemente ai contenuti multilingue. Googlebot è notevolmente meno multilingue con solo il 10,4%. Il basso tasso del 4,7% di ChatGPT-User riflette il fatto che è guidato da utenti umani, non da crawling automatizzato.