Ruch botow AI gwaltownie przyspiesza. 48 dni logow serwera ujawnia, co robia GPTBot, ChatGPT, ClaudeBot i 16 innych.
Ruch botow AI to juz nie strumyczek
Miedzy lutym a polowa marca 2026 roku aktywnosc botow AI na wislr.com nie tylko rosla. Zmienila ksztalt.
- Ruch ChatGPT-User wzrosl 5-krotnie w ciagu siedmiu tygodni
- GPTBot, calkowicie nieobecny do 12 marca, wykonal 187 zapytan w ciagu jednego tygodnia, z czego 152 w 3-minutowej serii
- GPTBot nie jest nowym botem. To glowny crawler treningowy OpenAI, aktywny w sieci od lat. Nie wydaje sie jednak crawlowac kazdej strony w sposob ciagly. Dane sugeruja, ze aktywuje sie na stronie, gdy jej tresc zyskuje na znaczeniu w ekosystemie OpenAI. Przekierowania ChatGPT-User na wislr.com juz wczesniej wzrosly 5-krotnie, zanim GPTBot sie w ogole pojawil.
- Wolumen OAI-SearchBot wzrosl 4-krotnie
- 18-19 marca zarowno ClaudeBot, jak i GPTBot zaczely po raz pierwszy odpytywac sitemap.xml, tego samego dnia, z roznych firm
To zmiana w sposobie, w jaki platformy AI odkrywaja i indeksuja tresc.
20 wnioskow dla Twojej strony
- Google Analytics nie widzi niczego z tego. Boty AI nie wykonuja JavaScript. Jesli polegasz na analityce po stronie klienta, Twoj ruch botow AI jest niewidoczny. Jedynym sposobem na jego pomiar jest logowanie po stronie serwera.
- Twoj sitemap.xml wlasnie zyskal na znaczeniu. GPTBot i ClaudeBot po raz pierwszy zaczely korzystac z sitemapow w marcu 2026. Jesli Twoj sitemap jest nieaktualny, niekompletny lub brakuje w nim wariantow jezykowych, crawlery AI omina tresc.
- robots.txt nie jest powszechnie respektowany. GPTBot i Meta-WebIndexer nigdy go nie sprawdzaja. Jesli Twoja strategia tresci AI opiera sie na dyrektywach robots.txt, pamietaj, ze dwoch z najaktywniejszych crawlerow calkowicie je ignoruje.
- Tresc wielojezyczna otrzymuje nieproporcjonalnie duzo uwagi crawlerow. Boty takie jak Meta-WebIndexer (80%), GPTBot (62%) i Bingbot (60%) wydaja wiekszosc swojego budzetu na warianty jezykowe. Jesli publikujesz przetlumaczona tresc, platformy AI indeksuja ja agresywnie.
- Ruch ChatGPT-User to bezposredni sygnal cytowania marki w rozmowach AI. Kazde zapytanie reprezentuje prawdziwego uzytkownika wklejajacego Twoj URL do ChatGPT. To mierzalny marketing szeptany i rosnie szybko.
- Boty AI crawluja seriami, nie stalym strumieniem. GPTBot osiagnal 114 zap./min w 3-minutowym oknie. Jesli Twoj serwer nie radzi sobie z naglymi skokami ruchu, crawlery AI moga byc ograniczane lub napotykac bledy podczas sesji indeksowania.
- OpenAI i Anthropic operuja po 3 oddzielne boty. Jeden do treningu/indeksowania, jeden do wyszukiwania, jeden do sesji uzytkownikow na zywo. Zablokowanie jednego nie blokuje pozostalych. Twoj robots.txt potrzebuje oddzielnych dyrektyw dla kazdego.
- OAI-SearchBot i Googlebot to jedyne boty pobierajace obrazy na duza skale. Jesli Twoje obrazy w artykulach zawieraja istotna tresc (wykresy, diagramy, wizualizacje danych), to te boty beda je wykorzystywac w wynikach wyszukiwania.
- ChatGPT-User wyciaga tylko tekst. Zero obrazow, zero CSS, zero JS. Twoja tresc HTML jest tym, co trafia do rozmow AI. Ustrukturyzowany, czytelny tekst ma wieksze znaczenie niz projekt wizualny dla widocznosci w AI.
- Crawlery AI osiagaja szczyt o roznych godzinach. GPTBot trafia o 04:00 UTC. Claude-SearchBot osiaga szczyt w nocy. PerplexityBot ma serie o 23:00, 05:00 i 09:00. Jesli wdrazasz zmiany na stronie poza godzinami szczytu w USA, boty AI moga je zobaczyc jako pierwsze.
- Meta jest najagresywniejszym crawlerem AI pod wzgledem wolumenu. Meta-WebIndexer wyslal wiecej zapytan niz jakikolwiek inny bot w tym zbiorze danych, z zerowymi sprawdzeniami robots.txt. Jesli nie sledzisz crawlerow Meta, pomijasz najwiekszego gracza.
- Adopcja llms.txt jest wciaz teoretyczna. Zero botow AI odpytylo /llms.txt w ciagu 48 dni. Moze w koncu stac sie standardem, ale zaden crawler obecnie go nie szuka.
- Applebot w pelni renderuje Twoje strony. Pobiera CSS, JS i obrazy (47% jego ruchu). Jesli Twoja tresc wymaga renderowania JavaScript, aby byla kompletna, Applebot ja zobaczy, ale wiekszosc botow AI nie.
- Ruch ChatGPT-User jest globalnie rozproszony. 15 krajow, 584 unikalne adresy IP. Twoja tresc jest cytowana w rozmowach AI na calym swiecie, nie tylko w USA.
- Tresc techniczna i poradnikowa jest najczesciej cytowana w rozmowach AI. Najczesciej odwiedzane strony ChatGPT-User to przewodniki implementacyjne i wyjasnienia techniczne. Glebokie, szczegolowe tresci zdobywaja cytowania w AI.
- Bytespider i CCBot sprawdzaja tylko robots.txt i nigdy nie crawluja. Konsumuja Twoje dyrektywy robots.txt bez dalszego dzialania. To moze sie zmienic, ale obecnie generuja obciazenie zgodnoscia bez indeksowania tresci.
- Wolumen crawlowania AI moze zmienic sie z dnia na dzien. GPTBot przeszedl od 0 do 187 zapytan w ciagu jednego tygodnia. Twoje prognozy budzetu crawlowania musza uwzgledniac nagle skoki, a nie stopniowy wzrost.
- Analiza IP ujawnia tozsamosc bota. Stosunek IP do zapytan ChatGPT-User bliski 1:1 dowodzi indywidualnych sesji uzytkownikow. 2 adresy IP GPTBot dowodza scentralizowanej infrastruktury. Wzorce IP pomagaja odroznic pobieranie wywolane przez uzytkownikow od automatycznego crawlowania.
- Skoordynowane zdarzenia crawlowania zachodza w ramach rodzin botow. GPTBot i OAI-SearchBot uruchomily sie jednoczesnie 19 marca z tej samej infrastruktury Microsoft. Gdy jeden bot OpenAI przyspiesza, mozna oczekiwac, ze pozostale podaza za nim.
- Boty, o ktorych nigdy nie slyszales, juz odwiedzaja Twoja strone. PromptingBot, LinkupBot, Brightbot, Observer i inne aktywnie crawluja tresc. Krajobraz botow AI jest szerszy, niz sugeruja dobrze znane nazwy.
Dane
Zrodlo: 288 566 plikow logow z logowania zapytan CDN na wislr.com
Okres: od 1 lutego do 20 marca 2026
Lacznie zapytan: 71 603
Przeanalizowane zapytania botow AI/crawlerow: 12 099 (16,9% calego ruchu)
Kazde zapytanie HTTP do wislr.com przechodzi przez skrypt CDN, ktory przechwytuje pelne metadane zapytania (user agent, geolokalizacja, naglowki, czas). Daje to nam pewnosc co do tego, co dokladnie robia boty AI, jak czesto i co czytaja.
Chcesz miec taki poziom widocznosci ruchu botow AI na swojej stronie?
Umow rozmoweRanking wolumenu botow
| Pozycja | Bot | Lacznie trafien | Lut | Mar (czesciowy) | Trend |
|---|---|---|---|---|---|
| 1 | Meta-WebIndexer | 1 833 | 707 | 1 126 | +59% |
| 2 | Bingbot | 1 221 | 547 | 674 | +23% |
| 3 | ChatGPT-User | 923 | 230 | 693 | +201% |
| 4 | Googlebot | 816 | 386 | 430 | +11% |
| 5 | Claude-SearchBot | 549 | 216 | 333 | +54% |
| 6 | Applebot | 495 | 257 | 238 | -7% |
| 7 | PerplexityBot | 456 | 244 | 212 | -13% |
| 8 | OAI-SearchBot | 330 | 117 | 213 | +82% |
| 9 | ClaudeBot | 206 | 69 | 137 | +99% |
| 10 | GPTBot* | 187 | 0 | 187 | Nowy w marcu |
| 11 | Amazonbot | 71 | 27 | 44 | +63% |
| 12 | Bytespider | 68 | 33 | 35 | +6% |
| 13 | Claude-User | 18 | 6 | 12 | +100% |
| 14 | CCBot | 5 | 2 | 3 | Minimalny |
| 15 | Meta-ExternalAgent | 4 | 0 | 4 | Nowy |
| 16 | DuckAssistBot | 4 | 0 | 4 | Nowy |
| 17 | Perplexity-User | 3 | 3 | 0 | Minimalny |
| 18 | YouBot | 2 | 0 | 2 | Nowy |
| 19 | GoogleOther | 2 | 1 | 1 | Minimalny |
*GPTBot nie jest nowym botem. To glowny crawler treningowy OpenAI, aktywny w sieci od lat. “Nowy w marcu” oznacza nowy na tej stronie. Dane sugeruja, ze GPTBot aktywuje sie na stronie, gdy jej tresc zyskuje na znaczeniu w ekosystemie OpenAI: przekierowania ChatGPT-User juz wczesniej wzrosly 5-krotnie, zanim GPTBot sie w ogole pojawil.
Tygodniowe trendy wolumenu
| Bot | Lut T1 | Lut T2 | Lut T3 | Lut T4 | Mar T1 | Mar T2 | Mar T3 |
|---|---|---|---|---|---|---|---|
| GPTBot | 0 | 0 | 0 | 0 | 0 | 4 | 183 |
| ChatGPT-User | 39 | 66 | 65 | 60 | 72 | 304 | 317 |
| OAI-SearchBot | 28 | 34 | 29 | 26 | 28 | 46 | 139 |
| ClaudeBot | 10 | 14 | 9 | 36 | 51 | 24 | 62 |
| Claude-SearchBot | 31 | 51 | 47 | 87 | 121 | 68 | 144 |
| PerplexityBot | 22 | 132 | 62 | 28 | 37 | 77 | 98 |
| Bingbot | 132 | 163 | 136 | 116 | 151 | 248 | 275 |
| Meta-WebIndexer | 63 | 35 | 271 | 338 | 396 | 541 | 189 |
| Amazonbot | 8 | 6 | 7 | 6 | 2 | 2 | 40 |
Marzec T3 (15-20 marca) byl przelomowym tygodniem. GPTBot eksplodowal z prawie zera do 183 zapytan. ChatGPT-User utrzymal ponad 300 tygodniowo (5-krotnosc swojej lutowej bazy). OAI-SearchBot osiagnal 139, co stanowi 4-krotny skok. Cos skoordynowanego wydarzylo sie w calej flocie botow OpenAI.
Profile poszczegolnych botow
GPTBot (crawler treningowy/indeksujacy OpenAI)
Lacznie: 187 zapytan | Aktywny od: 12 marca | IP: 2 (bardzo skoncentrowane)
GPTBot nie jest nowym botem. OpenAI definiuje go jako crawler uzywany do “uczynienia naszych generatywnych modeli AI bardziej uzytecznymi i bezpiecznymi”, crawlujacy tresc, ktora moze byc wykorzystana do trenowania ich modeli bazowych. Dziala w sieci od lat. Godne uwagi jest to, ze GPTBot byl calkowicie nieobecny na wislr.com do 12 marca, a nastepnie aktywowal sie z masowa seria crawlowania 19 marca o 04:38 UTC: 152 zapytan w 3 minuty (szczyt 114 zap./min). Systematycznie crawlowal kazdy artykul w kazdym wariancie jezykowym.
Sugeruje to, ze GPTBot nie crawluje kazdej strony w sposob ciagly. Wydaje sie aktywowac i przyspieszac na stronie, gdy jej tresc zyskuje na znaczeniu w ekosystemie OpenAI, poniewaz przekierowania ChatGPT-User na wislr.com juz wczesniej wzrosly 5-krotnie, zanim GPTBot sie pojawil.
Co crawluje:
- Artykuly: 67% zapytan
- Warianty jezykowe: 61,5%, crawlowal wszystkie 11 wersji jezykowych (de, fr, pl, hi, nl, uk, pt, ms, tr, it, es)
- Obrazy: 28 zapytan (naglowki artykulow, zdjecia autorow)
- Sitemap.xml: 2 zapytania (od 19 marca, zupelnie nowe zachowanie)
- robots.txt: Zero. Nigdy nie sprawdza.
Czas crawlowania: 81% wszystkich zapytan o 04:00 UTC. Ekstremalny wzorzec seryjny, prawie caly ruch w jednym 3-minutowym oknie.
Infrastruktura: Dziala z ASN Microsoft Limited, tylko USA. 97,9% ruchu z jednego adresu IP.
Seria GPTBot z 19 marca zbiegla sie z seria OAI-SearchBot z tej samej infrastruktury Microsoft: 50 zap./min w tym samym momencie. Wyglada to na skoordynowane dzialanie.
OAI-SearchBot (crawler wyszukiwania OpenAI)
Lacznie: 330 zapytan | Trend: +82% lut do mar | IP: 81
OAI-SearchBot to dedykowany crawler wyszukiwania OpenAI, odrebny od GPTBot. Jest najbardziej wytrwalym sprawdzajacym robots.txt sposrod wszystkich botow AI, odpytujac go 3-6 razy kazdego dnia bez wyjatku.
Co crawluje:
- robots.txt: 54,5% calego ruchu (180 trafien, srednio 3,8/dzien)
- Artykuly: 52 zapytania
- Obrazy: 55 zapytan, aktywnie pobiera obrazy artykulow, zdjecia autorow, zrzuty ekranu
- Strona glowna: 9 zapytan
Czas crawlowania: Rozlozony na caly dzien z niewielkimi szczytami o 04:00 i 20:00 UTC.
Infrastruktura: Microsoft Limited (87%) + Microsoft Corp (13%), tylko USA.
Jedyny bot OpenAI, ktory respektuje robots.txt (sprawdza go obsesyjnie). Takze jedyny bot AI poza Googlebot, ktory aktywnie pobiera obrazy na duza skale, prawdopodobnie na potrzeby kart wynikow wyszukiwania.
ChatGPT-User (pobieranie sesji uzytkownika na zywo)
Lacznie: 923 zapytania | Trend: +201% lut do mar | IP: 584
To nie jest crawler. Uruchamia sie, gdy prawdziwy uzytkownik wkleja URL wislr.com do rozmowy w ChatGPT. 584 unikalne adresy IP (prawie 1:1 z zapytaniami) potwierdzaja, ze sa to indywidualne sesje uzytkownikow. To najjaniejszy sygnal tego, jak czesto tresc wislr.com jest cytowana w rozmowach AI.
Najczesciej cytowana tresc:
| Trafienia | Artykul |
|---|---|
| 225 | Shopify Same-Domain Checkout Analytics |
| 112 | Cloudflare Crawl Endpoint Pros and Cons |
| 103 | Cloudflare Crawl Best Settings |
| 91 | Cloudflare CDN Request Logging for Shopify |
| 81 | 6 Core Tasks for Better 301 Redirects |
| 50 | AI Performance Metrics: Seven KPIs |
| 37 | Homepage |
| 30 | Essential Tools for Site Migrations |
| 29 | OpenAI KPIs and Success Metrics 2026 |
| 23 | AEO Readiness Comparison |
Czego nie pobiera: Zero obrazow, zero CSS, zero JS. Czysta ekstrakcja tresci HTML, interesuje go tylko tekst.
Czas crawlowania: Rownomiernie rozlozony na wszystkie 24 godziny, odpowiada wzorcom uzytkowania przez ludzi.
Rozklad geograficzny: USA (50%), Polska (16%), Australia (5%), Hiszpania (5%), Japonia (5%), Brazylia (4%), lacznie 15 krajow. Glowne miasta: Warszawa (149), Phoenix (145), San Antonio (126), Des Moines (91).
ClaudeBot (crawler treningowy/indeksujacy Anthropic)
Lacznie: 206 zapytan | Trend: +99% lut do mar | IP: 22
ClaudeBot jest zdecydowanie skoncentrowany na sprawdzaniu zgodnosci: 85% jego ruchu to robots.txt.
Co crawluje:
- robots.txt: 175 zapytan (85%), wzrost z 1-2/dzien na poczatku lutego do 6-12/dzien w marcu
- Sitemap.xml: 14 zapytan, od 18 marca (wczesniej nigdy go nie odpytywal)
- Obrazy: 10 zapytan (wszystkie 18 marca)
- Strony z trescia: bardzo niewiele
ClaudeBot sprawdza robots.txt coraz agresywniej z uplywem czasu. Jego nagle zainteresowanie sitemap.xml 18 marca (5 trafien tego dnia, 8 dnia 19 marca) sugeruje wdrozenie nowej strategii crawlowania przez Anthropic.
Infrastruktura: ASN Anthropic, PBC (97%), tylko USA.
Claude-SearchBot (crawler wyszukiwania Anthropic)
Lacznie: 549 zapytan | Trend: +54% lut do mar | IP: 8
Oddzielny bot Anthropic, odrebny od ClaudeBot i Claude-User. Obsluguje funkcje wyszukiwania internetowego Claude. Bardziej agresywny niz ClaudeBot, faktycznie crawluje tresc.
Co crawluje:
- robots.txt: 164 zapytania (30%), codziennie, wzrost z 1-3 do 7-10/dzien
- Sitemap.xml: 135 zapytan, od 25 lutego, szybko stal sie drugim najaktywniejszym konsumentem sitemap po Bingbot
- Artykuly: 142 zapytania (26%)
- Warianty jezykowe: 23,3% ruchu
- Strona glowna: 45 zapytan
Czas crawlowania: Wazony nocnie, szczyty o 22:00, 01:00, 00:00 UTC.
Lacznie Anthropic operuje 3 oddzielne boty (ClaudeBot, Claude-SearchBot, Claude-User), generujace 773 zapytania, co czyni Anthropic trzecia co do wielkosci obecnoscia botow AI po Meta-WebIndexer i ChatGPT-User.
Claude-User (pobieranie sesji uzytkownika na zywo Anthropic)
Lacznie: 18 zapytan | IP: 8
Odpowiednik ChatGPT-User od Anthropic. Uruchamia sie, gdy ktos udostepnia URL w rozmowie z Claude. Znacznie nizszy wolumen niz ChatGPT-User (18 vs 923).
Co crawluje: robots.txt (9), nastepnie artykuly o Cloudflare i studium przypadku kancelarii prawnej.
Infrastruktura: ASN Google LLC (100%), tylko USA. Dziala przez Google Cloud, nie wlasna infrastrukture Anthropic.
PerplexityBot (crawler indeksujacy Perplexity)
Lacznie: 456 zapytan | Trend: -13% lut do mar | IP: 13
Seryjny wzorzec crawlowania: 132 zapytania w Lut T2, spadek do 28 w Lut T4, powrot do 98 w Mar T3.
Co crawluje:
- Artykuly: 77% ruchu, intensywnie celuje w tresc dotyczaca metryk wydajnosci AI
- robots.txt: 71 zapytan (stabilnie 1-4/dzien)
- Obrazy: 18 zapytan (obrazy specyficzne dla artykulow)
- Sitemap.xml: Zero. Nigdy nie odpytuje.
- Warianty jezykowe: 52,9%, szerokie pokrycie wielojezyczne
Czas crawlowania: Trzy odrebne okna serii o 23:00, 05:00 i 09:00 UTC.
Infrastruktura: Amazon Technologies Inc. (96%), tylko USA. 13 adresow IP, umiarkowana koncentracja.
Googlebot
Lacznie: 816 zapytan | IP: 72
Skoncentrowany na stronie glownej (27% ruchu) i najbardziej “pelnie renderujacy” crawler. Pobiera obrazy, CSS, JS obok tresci.
Co crawluje:
- Strona glowna: 220 zapytan (27%)
- Obrazy: 152 zapytania
- CSS: 132 zapytania
- JS: 54 zapytania
- Artykuly: 141 zapytan
- robots.txt: 68 zapytan
- Sitemap.xml: 5 zapytan (sporadycznie)
Warianty jezykowe: Tylko 10,4%, znacznie mniej wielojezyczny niz inne boty.
Infrastruktura: Google LLC (91%), czesc ze Szwecji (8%). Jednolity 24-godzinny wzorzec crawlowania.
Bingbot
Lacznie: 1 221 zapytan | Trend: +23% lut do mar | IP: 258
Najbardziej konsekwentny i szeroki crawler. Takze dominujacy konsument sitemap.
Co crawluje:
- Artykuly: 68% (z intensywnym pokryciem wariantow jezykowych)
- Sitemap.xml: 139 zapytan (2-8/dzien, codziennie), zdecydowanie najaktywniejszy crawler sitemap
- Obrazy: 78 zapytan (ikony spolecznosciowe, zrzuty dashboardu, obrazy artykulow)
- robots.txt: 36 zapytan
Warianty jezykowe: 60,3%, intensywny nacisk na warianty holenderskie (97) i niemieckie (98).
Czas crawlowania: Jednolite pokrycie 24-godzinne, zawsze aktywny.
Meta-WebIndexer
Lacznie: 1 833 zapytania | Trend: +59% lut do mar | IP: 156
Bot o najwyzszym wolumenie ogolnie. Zdecydowanie skoncentrowany na tresci, szczegolnie wariantach jezykowych.
Co crawluje:
- Artykuly: 88% ruchu
- Warianty jezykowe: 79,8%, zdecydowanie najagresywniejszy wielojezyczny crawler
- Sitemap.xml: 30 zapytan
- robots.txt: Zero. Nie sprawdza robots.txt w ogole.
Czas crawlowania: Nasilenie wieczorno-nocne, szczyty o 20:00-21:00 i 00:00-01:00 UTC.
Infrastruktura: ASN Meta Platforms Ireland Ltd, tylko USA.
Podobnie jak GPTBot, Meta-WebIndexer nie sprawdza robots.txt. W przeciwienstwie do GPTBot, byl konsekwentnie aktywny przez caly okres.
Wzorce behawioralne
Zgodnosc z robots.txt
| Zachowanie | Boty |
|---|---|
| Obsesyjni sprawdzajacy (wiele razy dziennie) | OAI-SearchBot (3,8/dzien), ClaudeBot (4/dzien), Claude-SearchBot (4/dzien) |
| Regularni sprawdzajacy (codziennie lub prawie codziennie) | PerplexityBot, Googlebot, Applebot, Amazonbot, FacebookExternalHit (dokladnie 1/dzien jak w zegarku) |
| Sprawdza tylko robots.txt, nic wiecej | Bytespider (100%), CCBot (100%) |
| Nigdy nie sprawdza robots.txt | GPTBot, Meta-WebIndexer, ChatGPT-User |
GPTBot i Meta-WebIndexer to boty wyraznie niezgodne z zasadami. Crawluja agresywnie bez sprawdzania regul.
Odkrywanie sitemap
| Bot | Trafienia sitemap | Pierwsze zapytanie | Wzorzec |
|---|---|---|---|
| Bingbot | 139 | 1 lut | Codziennie, 2-8/dzien (krol sitemap) |
| Claude-SearchBot | 135 | 25 lut | Intensywne, stal sie 2. najaktywniejszy |
| Meta-WebIndexer | 30 | 5 lut | Regularne |
| ClaudeBot | 14 | 18 mar | Zupelnie nowe zachowanie |
| Googlebot | 5 | 2 lut | Sporadyczne |
| GPTBot | 2 | 19 mar | Zupelnie nowe zachowanie |
| Applebot | 1 | 17 mar | Pojedyncze trafienie |
18-19 marca to punkt zwrotny. Zarowno ClaudeBot, jak i GPTBot zaczely po raz pierwszy odpytywac sitemap.xml, co sugeruje jednoczesne wdrozenie nowych strategii crawlowania przez Anthropic i OpenAI.
Zapytania o llms.txt / pliki specyficzne dla AI
Zaden bot AI nie odpytuje /llms.txt ani /llm.txt. Zero trafien od GPTBot, ClaudeBot, PerplexityBot ani zadnego innego crawlera AI.
Jedynym botem sprawdzajacym llms.txt jest Dataprovider.com (firma analityki internetowej): 3 zapytania w okresie lut-mar.
Dwa zapytania o /.well-known/ai-plugin.json pochodzily z przegladarek Firefox, nie od botow.
Crawlowanie wariantow jezykowych
| Bot | % ruchu w wariantach jezykowych | Pokrycie |
|---|---|---|
| Meta-WebIndexer | 79,8% | Wszystkie 11 jezykow, rownomiernie rozlozone |
| GPTBot | 61,5% | Wszystkie 11 jezykow, 8-12 na kazdy |
| Bingbot | 60,3% | Wszystkie 11, nasilenie na holenderski/niemiecki |
| PerplexityBot | 52,9% | Wszystkie 11, niemiecki/hiszpanski na czele |
| Amazonbot | 32,4% | Wszystkie 11 |
| Claude-SearchBot | 23,3% | Wszystkie 11, dosc rownomiernie |
| Applebot | 23,0% | Wszystkie 11 |
| OAI-SearchBot | 11,2% | Wszystkie 11 |
| Googlebot | 10,4% | Hiszpanski/portugalski na czele |
| ChatGPT-User | 4,7% | Francuski/hiszpanski/wloski (napedzane przez uzytkownikow) |
Meta-WebIndexer i GPTBot to najagresywniejsze wielojezyczne crawlery. Niski procent ChatGPT-User ma sens: odzwierciedla, w jakich jezykach czytaja prawdziwi uzytkownicy.
Crawlowanie obrazow
| Bot | Zapytania o obrazy | Co pobieraja |
|---|---|---|
| Googlebot | 152 | Ikony SVG, loga, favicony, zasoby renderowania |
| Google-InspectionTool | 108 | Ikony spolecznosciowe, obrazy studiow przypadku |
| Googlebot-Image | 75 | Favicon, warianty logo, obrazy artykulow |
| Bingbot | 78 | Ikony spolecznosciowe, zrzuty dashboardu, obrazy artykulow |
| OAI-SearchBot | 55 | Obrazy artykulow, zdjecia autorow, zrzuty ekranu |
| Applebot | 32 | Okladki artykulow |
| GPTBot | 28 | Naglowki artykulow, zdjecia autorow (wszystkie 19 mar) |
| PerplexityBot | 18 | Obrazy artykulow |
| ClaudeBot | 10 | Zdjecia autorow, zrzuty ekranu (wszystkie 18 mar) |
| ChatGPT-User | 0 | Nigdy nie pobiera obrazow |
Googlebot pobiera obrazy do renderowania. OAI-SearchBot prawdopodobnie pobiera je na potrzeby kart wynikow wyszukiwania. GPTBot i ClaudeBot przeprowadzily skoncentrowane serie pobierania obrazow w ciagu jednego dnia, co sugeruje zbiorcze sesje indeksowania.
ChatGPT-User pobiera zero obrazow. Czysta ekstrakcja tekstu.
Inne godne uwagi odkryte boty
PromptingBot/1.0.0 (104 zapytania)
- Dziala na infrastrukturze Google Cloud
- Aktywny od 24 lutego do 13 marca
- Wykonuje pelne renderowanie strony (pobiera CSS, JS, obrazy, ikony spolecznosciowe)
- Celuje w tresc dotyczaca metryk wydajnosci AI
LinkupBot/1.0 (47 zapytan)
- Od linkup.so, usluga indeksowania sieci
- Infrastruktura Microsoft, pochodzenie: Francja
- Sprawdza robots.txt, nastepnie koncentruje sie na tresciach o migracjach/przekierowaniach
Brightbot 1.0 (46 zapytan)
- Od truview LLC, 41 unikalnych adresow IP
- Koncentruje sie na holenderskich wariantach jezykowych
Observer/1.0 (36 zapytan)
- Od obsrvr.net, infrastruktura niemiecko-finska
- Crawluje tylko robots.txt i pojedynczy artykul po francusku
Dataprovider.com (148 zapytan)
- Kanadyjska firma analityki internetowej
- Jedyny bot, ktory sprawdza /llms.txt (3 razy)
- Sprawdza rowniez /ads.txt i /humans.txt
Metody HTTP
Kazdy bot uzywa wylacznie GET. Zero HEAD, POST ani innych metod wsrod wszystkich 12 099 zapytan botow.
Dane dotyczace krajow/ASN
| Bot | Glowny ASN | Kraje |
|---|---|---|
| GPTBot | Microsoft Limited | Tylko USA |
| OAI-SearchBot | Microsoft Limited (87%) + Microsoft Corp (13%) | Tylko USA |
| ChatGPT-User | Microsoft Corporation (78%) | USA (50%), Polska (16%), Australia (5%), Hiszpania (5%), Japonia (5%), Brazylia (4%), 15 krajow |
| ClaudeBot | Anthropic, PBC (97%) | Tylko USA |
| Claude-SearchBot | Anthropic, PBC (100%) | Tylko USA |
| Claude-User | Google LLC (100%) | Tylko USA |
| PerplexityBot | Amazon Technologies Inc. (96%) | Tylko USA |
| Amazonbot | Amazon (100%) | Tylko USA |
| Applebot | Apple Inc. (100%) | Tylko USA |
| Bingbot | Microsoft Corporation (99,7%) | Tylko USA |
| Googlebot | Google LLC (91%) | USA (92%), Szwecja (8%) |
| Meta-WebIndexer | Meta Platforms Ireland Ltd (100%) | Tylko USA |
| Bytespider | Amazon Singapore (53%), China Unicom (47%) | Singapur (53%), Chiny (47%) |
Wszystkie glowne boty AI dzialaja z infrastruktury w USA z wyjatkiem Bytespider (Singapur/Chiny). ChatGPT-User jest jedynym botem z prawdziwie globalnym rozkladem, odzwierciedlajac baze ludzkich uzytkownikow.
Najczesciej zadawane pytania
Ktore boty AI najczesciej odwiedzaja strony internetowe w 2026 roku?
Na podstawie 48 dni danych z logow serwera wislr.com, boty AI o najwyzszym wolumenie to Meta-WebIndexer (1 833 zapytan), ChatGPT-User (923 zapytan), Claude-SearchBot (549 zapytan), Applebot (495 zapytan), PerplexityBot (456 zapytan), OAI-SearchBot (330 zapytan), ClaudeBot (206 zapytan) i GPTBot (187 zapytan). ChatGPT-User wykazal najostrzejszy wzrost na poziomie +201% miedzy lutym a marcem 2026.
Czy boty AI sprawdzaja robots.txt przed crawlowaniem?
To sie znacznie rozni. OAI-SearchBot sprawdza robots.txt 3-6 razy dziennie bez wyjatku. ClaudeBot i Claude-SearchBot sprawdzaja srednio 4 razy dziennie. Bytespider i CCBot sprawdzaja tylko robots.txt i nigdy nie crawluja zadnej tresci. Jednak GPTBot i Meta-WebIndexer nigdy nie sprawdzaja robots.txt, mimo ze naleza do najaktywniejszych crawlerow. ChatGPT-User rowniez nigdy nie sprawdza robots.txt.
Czy jakikolwiek bot AI odpytuje llms.txt?
Nie. Wsrod 12 099 zapytan botow w ciagu 48 dni, zero botow AI odpytylo /llms.txt lub /llm.txt. Jedynym botem, ktory sprawdzil llms.txt, byl Dataprovider.com, firma analityki internetowej, a nie platforma AI. Pomimo rosnacej dyskusji wokol llms.txt jako standardu, zaden crawler AI aktualnie go nie szuka w praktyce.
Jaka jest roznica miedzy GPTBot a ChatGPT-User?
GPTBot to crawler treningowy i indeksujacy OpenAI, ktory systematycznie crawluje strony, warianty jezykowe i obrazy w skoncentrowanych seriach, czesto bez sprawdzania robots.txt. ChatGPT-User uruchamia sie, gdy prawdziwy uzytkownik wkleja URL do rozmowy w ChatGPT. ChatGPT-User mial 584 unikalne adresy IP na 923 zapytan (prawie 1:1), co potwierdza indywidualne sesje uzytkownikow. ChatGPT-User pobiera tylko tekst HTML, nigdy obrazow, CSS ani JS. GPTBot pobiera wszystkie typy zasobow.
Jak mozna wykryc ruch botow AI na swojej stronie?
Ruch botow AI jest niewidoczny dla narzedzi analitycznych dzialajacych po stronie klienta, takich jak Google Analytics, poniewaz boty nie wykonuja JavaScript. Potrzebujesz logowania zapytan po stronie serwera, ktore przechwytuje surowe zapytania HTTP trafiajace do Twojej domeny, w tym naglowek User-Agent identyfikujacy boty takie jak GPTBot, ChatGPT-User, ClaudeBot i inne. WISLR AI Visibility Dashboard zapewnia ten poziom widocznosci od razu.
Ktore boty AI najagresywniej crawluja tresc wielojezyczna?
Meta-WebIndexer przeznacza 79,8% swojego budzetu crawlowania na warianty jezykowe, co czyni go najagresywniejszym wielojezycznym crawlerem. GPTBot jest nastepny z 61,5%, crawlujac wszystkie 11 wersji jezykowych artykulow. Bingbot (60,3%) i PerplexityBot (52,9%) rowniez intensywnie celuja w tresc wielojezyczna. Googlebot jest wyraznie mniej wielojezyczny, z zaledwie 10,4%. Niski wskaznik ChatGPT-User na poziomie 4,7% odzwierciedla fakt, ze jest napedzany przez ludzi, a nie automatyczne crawlowanie.