AI बॉट ट्रैफ़िक तेज़ी से बढ़ रहा है। 48 दिनों के सर्वर लॉग्स से GPTBot, ChatGPT, ClaudeBot और 16 अन्य बॉट्स की गतिविधि उजागर।
AI बॉट ट्रैफ़िक अब बूंद-बूंद नहीं रहा
फरवरी से मध्य मार्च 2026 के बीच, wislr.com पर AI बॉट गतिविधि सिर्फ बढ़ी नहीं। इसका स्वरूप बदल गया।
- ChatGPT-User ट्रैफ़िक सात हफ्तों में 5 गुना बढ़ा
- GPTBot, 12 मार्च तक पूरी तरह अनुपस्थित, ने एक ही सप्ताह में 187 अनुरोध किए, जिनमें से 152 एक 3 मिनट के बर्स्ट में
- GPTBot नया बॉट नहीं है। यह OpenAI का मुख्य प्रशिक्षण क्रॉलर है, जो वर्षों से पूरे वेब पर सक्रिय है। लेकिन यह हर साइट को लगातार क्रॉल नहीं करता। डेटा बताता है कि यह किसी साइट पर तब सक्रिय होता है जब उस साइट की सामग्री OpenAI के इकोसिस्टम में लोकप्रिय होती है। GPTBot के प्रकट होने से पहले ही wislr.com पर ChatGPT-User रेफरल 5 गुना बढ़ चुके थे।
- OAI-SearchBot वॉल्यूम 4 गुना बढ़ा
- 18-19 मार्च को, ClaudeBot और GPTBot दोनों ने पहली बार sitemap.xml का अनुरोध किया, एक ही दिन, अलग-अलग कंपनियों से
यह AI प्लेटफॉर्म द्वारा सामग्री की खोज और इंडेक्सिंग के तरीके में बदलाव है।
आपकी वेबसाइट के लिए 20 निष्कर्ष
- Google Analytics इसमें से कुछ भी नहीं देख सकता। AI बॉट्स JavaScript निष्पादित नहीं करते। यदि आप क्लाइंट-साइड एनालिटिक्स पर निर्भर हैं, तो आपका AI बॉट ट्रैफ़िक अदृश्य है। सर्वर-साइड लॉगिंग इसे मापने का एकमात्र तरीका है।
- आपकी sitemap.xml अब और महत्वपूर्ण हो गई है। GPTBot और ClaudeBot दोनों ने मार्च 2026 में पहली बार साइटमैप का उपयोग शुरू किया। यदि आपकी साइटमैप पुरानी, अधूरी या भाषा वेरिएंट गायब हैं, तो AI क्रॉलर सामग्री को मिस करेंगे।
- robots.txt का सार्वभौमिक सम्मान नहीं होता। GPTBot और Meta-WebIndexer कभी इसे जांचते नहीं। यदि आपकी AI सामग्री रणनीति robots.txt निर्देशों पर निर्भर है, तो जान लें कि दो सबसे सक्रिय क्रॉलर इन्हें पूरी तरह अनदेखा करते हैं।
- बहुभाषी सामग्री को असमान रूप से अधिक क्रॉल ध्यान मिलता है। Meta-WebIndexer (80%), GPTBot (62%), और Bingbot (60%) जैसे बॉट अपने बजट का अधिकांश भाग भाषा वेरिएंट पर खर्च करते हैं। यदि आप अनुवादित सामग्री प्रकाशित करते हैं, तो AI प्लेटफॉर्म इसे आक्रामक रूप से इंडेक्स कर रहे हैं।
- ChatGPT-User ट्रैफ़िक AI वार्तालापों में ब्रांड उद्धरण का प्रत्यक्ष संकेत है। प्रत्येक अनुरोध एक वास्तविक व्यक्ति द्वारा ChatGPT में आपका URL पेस्ट करने को दर्शाता है। यह मापने योग्य मौखिक प्रचार है, और यह तेज़ी से बढ़ रहा है।
- AI बॉट्स बर्स्ट में क्रॉल करते हैं, स्थिर धाराओं में नहीं। GPTBot ने 3 मिनट की विंडो में 114 req/min तक पहुंचा। यदि आपका सर्वर बर्स्ट ट्रैफ़िक संभाल नहीं सकता, तो AI क्रॉलर उनके इंडेक्सिंग रन के दौरान थ्रॉटल या एरर हो सकते हैं।
- OpenAI और Anthropic प्रत्येक 3 अलग-अलग बॉट्स संचालित करते हैं। एक प्रशिक्षण/इंडेक्सिंग के लिए, एक सर्च के लिए, एक लाइव उपयोगकर्ता सत्रों के लिए। एक को ब्लॉक करने से दूसरे ब्लॉक नहीं होते। आपके robots.txt को प्रत्येक के लिए अलग निर्देशों की आवश्यकता है।
- OAI-SearchBot और Googlebot एकमात्र बॉट्स हैं जो वॉल्यूम में इमेज लाते हैं। यदि आपके लेख की इमेज में सार्थक सामग्री है (चार्ट, डायग्राम, डेटा विज़ुअलाइज़ेशन), तो ये वे बॉट्स हैं जो इन्हें सर्च परिणामों में उपयोग करेंगे।
- ChatGPT-User केवल टेक्स्ट निकालता है। शून्य इमेज, शून्य CSS, शून्य JS। आपकी HTML सामग्री वह है जो AI वार्तालापों में खींची जाती है। AI दृश्यता के लिए संरचित, स्पष्ट टेक्स्ट विज़ुअल डिज़ाइन से अधिक महत्वपूर्ण है।
- AI क्रॉलर अलग-अलग समय पर पीक करते हैं। GPTBot 04:00 UTC पर आता है। Claude-SearchBot रात भर पीक करता है। PerplexityBot 23:00, 05:00 और 09:00 पर बर्स्ट करता है। यदि आप ऑफ-पीक US घंटों में साइट परिवर्तन लागू करते हैं, तो AI बॉट्स उन्हें सबसे पहले देख सकते हैं।
- Meta वॉल्यूम के हिसाब से सबसे आक्रामक AI क्रॉलर है। Meta-WebIndexer ने इस डेटासेट में किसी भी अन्य बॉट से अधिक अनुरोध भेजे, बिना किसी robots.txt जांच के। यदि आप Meta के क्रॉलर्स को ट्रैक नहीं कर रहे, तो आप सबसे बड़े खिलाड़ी को मिस कर रहे हैं।
- llms.txt अपनाना अभी भी सैद्धांतिक है। 48 दिनों में शून्य AI बॉट्स ने /llms.txt का अनुरोध किया। यह अंततः एक मानक बन सकता है, लेकिन वर्तमान में कोई क्रॉलर इसे नहीं खोजता।
- Applebot आपके पेज को पूरी तरह रेंडर करता है। यह CSS, JS और इमेज लाता है (इसके ट्रैफ़िक का 47%)। यदि आपकी सामग्री को पूर्ण होने के लिए JavaScript रेंडरिंग की आवश्यकता है, तो Applebot इसे देखेगा, लेकिन अधिकांश AI बॉट्स नहीं देखेंगे।
- ChatGPT-User ट्रैफ़िक वैश्विक रूप से वितरित है। 15 देश, 584 अद्वितीय IPs। आपकी सामग्री दुनिया भर में AI वार्तालापों में संदर्भित हो रही है, केवल US में नहीं।
- तकनीकी, how-to सामग्री AI वार्तालापों में सबसे अधिक संदर्भित होती है। शीर्ष ChatGPT-User पेज सभी कार्यान्वयन गाइड और तकनीकी व्याख्या थे। गहरी, विशिष्ट सामग्री AI उद्धरण अर्जित करती है।
- Bytespider और CCBot केवल robots.txt जांचते हैं और कभी क्रॉल नहीं करते। वे बिना आगे बढ़े आपके robots.txt निर्देशों का उपभोग कर रहे हैं। यह बदल सकता है, लेकिन वर्तमान में वे शून्य सामग्री इंडेक्सिंग के साथ अनुपालन ओवरहेड उत्पन्न करते हैं।
- AI क्रॉल वॉल्यूम रातोंरात बदल सकता है। GPTBot एक ही सप्ताह में 0 से 187 अनुरोधों तक पहुंचा। आपके क्रॉल बजट अनुमानों को क्रमिक वृद्धि के बजाय अचानक स्टेप-चेंज के लिए तैयार रहना चाहिए।
- IP विश्लेषण बॉट की पहचान प्रकट करता है। ChatGPT-User का लगभग 1:1 IP-से-अनुरोध अनुपात व्यक्तिगत उपयोगकर्ता सत्रों को प्रमाणित करता है। GPTBot के 2 IPs केंद्रीकृत इन्फ्रास्ट्रक्चर प्रमाणित करते हैं। IP पैटर्न वास्तविक उपयोगकर्ता-ट्रिगर फ़ेच को स्वचालित क्रॉलिंग से अलग करने में मदद करते हैं।
- बॉट परिवारों में समन्वित क्रॉल इवेंट होते हैं। GPTBot और OAI-SearchBot ने 19 मार्च को एक ही Microsoft इन्फ्रास्ट्रक्चर से एक साथ फायर किया। जब एक OpenAI बॉट बढ़ता है, तो बाकी के भी अनुसरण की अपेक्षा करें।
- जिन बॉट्स के बारे में आपने कभी नहीं सुना, वे पहले से विज़िट कर रहे हैं। PromptingBot, LinkupBot, Brightbot, Observer और अन्य सक्रिय रूप से सामग्री क्रॉल कर रहे हैं। AI बॉट परिदृश्य प्रसिद्ध नामों से कहीं बड़ा है।
डेटा
स्रोत: wislr.com पर CDN स्क्रिप्ट रिक्वेस्ट लॉगिंग से 288,566 लॉग फाइलें
अवधि: 1 फरवरी से 20 मार्च, 2026
कुल अनुरोध: 71,603
विश्लेषित AI/क्रॉलर बॉट अनुरोध: 12,099 (कुल ट्रैफ़िक का 16.9%)
wislr.com पर प्रत्येक HTTP अनुरोध एक CDN स्क्रिप्ट से गुज़रता है जो पूर्ण रिक्वेस्ट मेटाडेटा (user agent, geo, headers, timing) कैप्चर करता है। यह हमें इस बारे में सटीक जानकारी देता है कि AI बॉट्स क्या कर रहे हैं, कितनी बार और क्या पढ़ रहे हैं।
अपने AI बॉट ट्रैफ़िक में इस स्तर की दृश्यता चाहते हैं?
चैट शेड्यूल करेंबॉट वॉल्यूम रैंकिंग
| रैंक | बॉट | कुल हिट्स | फरवरी | मार्च (आंशिक) | रुझान |
|---|---|---|---|---|---|
| 1 | Meta-WebIndexer | 1,833 | 707 | 1,126 | +59% |
| 2 | Bingbot | 1,221 | 547 | 674 | +23% |
| 3 | ChatGPT-User | 923 | 230 | 693 | +201% |
| 4 | Googlebot | 816 | 386 | 430 | +11% |
| 5 | Claude-SearchBot | 549 | 216 | 333 | +54% |
| 6 | Applebot | 495 | 257 | 238 | -7% |
| 7 | PerplexityBot | 456 | 244 | 212 | -13% |
| 8 | OAI-SearchBot | 330 | 117 | 213 | +82% |
| 9 | ClaudeBot | 206 | 69 | 137 | +99% |
| 10 | GPTBot* | 187 | 0 | 187 | मार्च में नया |
| 11 | Amazonbot | 71 | 27 | 44 | +63% |
| 12 | Bytespider | 68 | 33 | 35 | +6% |
| 13 | Claude-User | 18 | 6 | 12 | +100% |
| 14 | CCBot | 5 | 2 | 3 | न्यूनतम |
| 15 | Meta-ExternalAgent | 4 | 0 | 4 | नया |
| 16 | DuckAssistBot | 4 | 0 | 4 | नया |
| 17 | Perplexity-User | 3 | 3 | 0 | न्यूनतम |
| 18 | YouBot | 2 | 0 | 2 | नया |
| 19 | GoogleOther | 2 | 1 | 1 | न्यूनतम |
*GPTBot कोई नया बॉट नहीं है। यह OpenAI का मुख्य प्रशिक्षण क्रॉलर है, जो वर्षों से पूरे वेब पर सक्रिय है। “मार्च में नया” का अर्थ है इस साइट पर नया। डेटा बताता है कि GPTBot किसी साइट पर तब सक्रिय होता है जब उसकी सामग्री OpenAI के इकोसिस्टम में लोकप्रिय होती है: GPTBot के प्रकट होने से पहले ही ChatGPT-User रेफरल 5 गुना बढ़ चुके थे।
साप्ताहिक वॉल्यूम रुझान
| बॉट | फरवरी W1 | फरवरी W2 | फरवरी W3 | फरवरी W4 | मार्च W1 | मार्च W2 | मार्च W3 |
|---|---|---|---|---|---|---|---|
| GPTBot | 0 | 0 | 0 | 0 | 0 | 4 | 183 |
| ChatGPT-User | 39 | 66 | 65 | 60 | 72 | 304 | 317 |
| OAI-SearchBot | 28 | 34 | 29 | 26 | 28 | 46 | 139 |
| ClaudeBot | 10 | 14 | 9 | 36 | 51 | 24 | 62 |
| Claude-SearchBot | 31 | 51 | 47 | 87 | 121 | 68 | 144 |
| PerplexityBot | 22 | 132 | 62 | 28 | 37 | 77 | 98 |
| Bingbot | 132 | 163 | 136 | 116 | 151 | 248 | 275 |
| Meta-WebIndexer | 63 | 35 | 271 | 338 | 396 | 541 | 189 |
| Amazonbot | 8 | 6 | 7 | 6 | 2 | 2 | 40 |
मार्च W3 (15-20 मार्च) एक ब्रेकआउट सप्ताह था। GPTBot लगभग शून्य से 183 अनुरोधों तक पहुंचा। ChatGPT-User ने 300+/सप्ताह बनाए रखा (अपने फरवरी बेसलाइन का 5 गुना)। OAI-SearchBot 139 पर पहुंचा, 4 गुना उछाल। OpenAI के बॉट फ्लीट में कुछ समन्वित हुआ।
व्यक्तिगत बॉट प्रोफाइल
GPTBot (OpenAI का प्रशिक्षण/इंडेक्सिंग क्रॉलर)
कुल: 187 अनुरोध | सक्रिय: 12 मार्च से | IPs: 2 (अत्यधिक केंद्रित)
GPTBot कोई नया बॉट नहीं है। OpenAI इसे उस क्रॉलर के रूप में परिभाषित करता है जो “हमारे जनरेटिव AI फाउंडेशन मॉडल को अधिक उपयोगी और सुरक्षित बनाने” के लिए उपयोग किया जाता है, जो उनके फाउंडेशन मॉडल के प्रशिक्षण में उपयोग की जा सकने वाली सामग्री को क्रॉल करता है। यह वर्षों से पूरे वेब पर सक्रिय है। यहां उल्लेखनीय बात यह है कि GPTBot 12 मार्च तक wislr.com पर पूरी तरह अनुपस्थित था, फिर 19 मार्च को 04:38 UTC पर एक विशाल क्रॉल बर्स्ट के साथ सक्रिय हुआ: 3 मिनट में 152 अनुरोध (114 req/min पीक)। इसने व्यवस्थित रूप से हर भाषा वेरिएंट में हर लेख को क्रॉल किया।
यह बताता है कि GPTBot हर साइट को लगातार क्रॉल नहीं करता। यह किसी साइट पर तब सक्रिय और तेज़ होता प्रतीत होता है जब उस साइट की सामग्री OpenAI के इकोसिस्टम में लोकप्रिय होती है, क्योंकि GPTBot के प्रकट होने से पहले ही wislr.com पर ChatGPT-User रेफरल 5 गुना बढ़ चुके थे।
यह क्या क्रॉल करता है:
- लेख: 67% अनुरोध
- भाषा वेरिएंट: 61.5%, सभी 11 भाषा संस्करण क्रॉल किए (de, fr, pl, hi, nl, uk, pt, ms, tr, it, es)
- इमेज: 28 अनुरोध (लेख हेडर, लेखक फोटो)
- Sitemap.xml: 2 अनुरोध (19 मार्च से शुरू, बिल्कुल नया व्यवहार)
- robots.txt: शून्य। कभी जांचता नहीं।
क्रॉल समय: सभी अनुरोधों का 81% 04:00 UTC पर। अत्यधिक बर्स्ट पैटर्न, लगभग सारा ट्रैफ़िक एक 3 मिनट की विंडो में।
इन्फ्रास्ट्रक्चर: Microsoft Limited ASN से चलता है, केवल US। 97.9% ट्रैफ़िक एक ही IP से।
GPTBot का 19 मार्च का बर्स्ट उसी Microsoft इन्फ्रास्ट्रक्चर से OAI-SearchBot बर्स्ट के साथ एक साथ हुआ: उसी टाइमस्टैम्प पर 50 req/min। यह समन्वित प्रतीत होता है।
OAI-SearchBot (OpenAI का सर्च क्रॉलर)
कुल: 330 अनुरोध | रुझान: फरवरी से मार्च +82% | IPs: 81
OAI-SearchBot, OpenAI का समर्पित सर्च क्रॉलर है, GPTBot से अलग। यह किसी भी AI बॉट में सबसे लगातार robots.txt जांचकर्ता है, बिना किसी अपवाद के हर एक दिन 3-6 बार इसे जांचता है।
यह क्या क्रॉल करता है:
- robots.txt: कुल ट्रैफ़िक का 54.5% (180 हिट्स, 3.8/दिन औसत)
- लेख: 52 अनुरोध
- इमेज: 55 अनुरोध, सक्रिय रूप से लेख इमेज, लेखक फोटो, पेज स्क्रीनशॉट डाउनलोड करता है
- होमपेज: 9 अनुरोध
क्रॉल समय: दिन भर फैला हुआ, 04:00 और 20:00 UTC पर हल्के पीक के साथ।
इन्फ्रास्ट्रक्चर: Microsoft Limited (87%) + Microsoft Corp (13%), केवल US।
एकमात्र OpenAI बॉट जो robots.txt का सम्मान करता है (इसे जुनूनी रूप से जांचता है)। Googlebot के अलावा एकमात्र AI बॉट जो सक्रिय रूप से वॉल्यूम में इमेज लाता है, संभवतः सर्च रिज़ल्ट कार्ड के लिए।
ChatGPT-User (लाइव उपयोगकर्ता सत्र फ़ेचर)
कुल: 923 अनुरोध | रुझान: फरवरी से मार्च +201% | IPs: 584
यह क्रॉलर नहीं है। यह तब फायर होता है जब कोई वास्तविक व्यक्ति ChatGPT वार्तालाप में wislr.com URL पेस्ट करता है। 584 अद्वितीय IPs (अनुरोधों के साथ लगभग 1:1) पुष्टि करते हैं कि ये व्यक्तिगत उपयोगकर्ता सत्र हैं। यह सबसे स्पष्ट संकेत है कि wislr.com सामग्री AI वार्तालापों में कितनी बार उद्धृत की जा रही है।
सबसे अधिक संदर्भित सामग्री:
| हिट्स | लेख |
|---|---|
| 225 | Shopify Same-Domain Checkout Analytics |
| 112 | Cloudflare Crawl Endpoint Pros and Cons |
| 103 | Cloudflare Crawl Best Settings |
| 91 | Cloudflare CDN Request Logging for Shopify |
| 81 | 6 Core Tasks for Better 301 Redirects |
| 50 | AI Performance Metrics: Seven KPIs |
| 37 | Homepage |
| 30 | Essential Tools for Site Migrations |
| 29 | OpenAI KPIs and Success Metrics 2026 |
| 23 | AEO Readiness Comparison |
यह क्या नहीं लाता: शून्य इमेज, शून्य CSS, शून्य JS। शुद्ध HTML सामग्री निष्कर्षण, यह केवल टेक्स्ट चाहता है।
क्रॉल समय: सभी 24 घंटों में समान रूप से वितरित, मानव उपयोग पैटर्न का अनुसरण करता है।
भौगोलिक वितरण: US (50%), Poland (16%), Australia (5%), Spain (5%), Japan (5%), Brazil (4%), कुल 15 देश। शीर्ष शहर: Warsaw (149), Phoenix (145), San Antonio (126), Des Moines (91)।
ClaudeBot (Anthropic का प्रशिक्षण/इंडेक्सिंग क्रॉलर)
कुल: 206 अनुरोध | रुझान: फरवरी से मार्च +99% | IPs: 22
ClaudeBot मुख्य रूप से अनुपालन जांच पर केंद्रित है: इसके 85% ट्रैफ़िक में robots.txt है।
यह क्या क्रॉल करता है:
- robots.txt: 175 अनुरोध (85%), फरवरी की शुरुआत में 1-2/दिन से बढ़कर मार्च तक 6-12/दिन
- Sitemap.xml: 14 अनुरोध, 18 मार्च से शुरू (इससे पहले कभी नहीं छुआ)
- इमेज: 10 अनुरोध (सभी 18 मार्च को)
- सामग्री पेज: बहुत कम
ClaudeBot समय के साथ robots.txt को अधिक आक्रामक रूप से जांचता है। 18 मार्च को sitemap.xml में इसकी अचानक रुचि (उस दिन 5 हिट्स, 19 मार्च को 8) Anthropic से एक नई क्रॉल रणनीति लॉन्च का संकेत देती है।
इन्फ्रास्ट्रक्चर: Anthropic, PBC ASN (97%), केवल US।
Claude-SearchBot (Anthropic का वेब सर्च क्रॉलर)
कुल: 549 अनुरोध | रुझान: फरवरी से मार्च +54% | IPs: 8
ClaudeBot और Claude-User से अलग एक पृथक Anthropic बॉट। यह Claude की वेब सर्च सुविधा को संचालित करता है। ClaudeBot से अधिक आक्रामक, वास्तव में सामग्री क्रॉल करता है।
यह क्या क्रॉल करता है:
- robots.txt: 164 अनुरोध (30%), दैनिक, 1-3 से बढ़कर 7-10/दिन
- Sitemap.xml: 135 अनुरोध, 25 फरवरी से शुरू, Bingbot के बाद तेज़ी से दूसरा सबसे सक्रिय साइटमैप उपभोक्ता बन गया
- लेख: 142 अनुरोध (26%)
- भाषा वेरिएंट: ट्रैफ़िक का 23.3%
- होमपेज: 45 अनुरोध
क्रॉल समय: रात्रि-भारित, 22:00, 01:00, 00:00 UTC पर पीक।
संयुक्त रूप से, Anthropic 3 अलग बॉट्स (ClaudeBot, Claude-SearchBot, Claude-User) संचालित करता है जिनके कुल 773 अनुरोध हैं, जो Anthropic को Meta-WebIndexer और ChatGPT-User के बाद तीसरी सबसे बड़ी AI बॉट उपस्थिति बनाता है।
Claude-User (Anthropic का लाइव सत्र फ़ेचर)
कुल: 18 अनुरोध | IPs: 8
ChatGPT-User का Anthropic समकक्ष। जब कोई Claude वार्तालाप में URL साझा करता है तब फायर होता है। ChatGPT-User से बहुत कम वॉल्यूम (18 बनाम 923)।
यह क्या क्रॉल करता है: robots.txt (9), फिर Cloudflare और एक लॉ फर्म केस स्टडी के बारे में लेख।
इन्फ्रास्ट्रक्चर: Google LLC ASN (100%), केवल US। Anthropic के अपने इन्फ्रा के बजाय Google Cloud के माध्यम से चलता है।
PerplexityBot (Perplexity का इंडेक्सिंग क्रॉलर)
कुल: 456 अनुरोध | रुझान: फरवरी से मार्च -13% | IPs: 13
बर्स्टी क्रॉल पैटर्न: फरवरी W2 में 132 अनुरोध, फरवरी W4 में 28 तक गिरा, मार्च W3 में फिर 98 तक बढ़ा।
यह क्या क्रॉल करता है:
- लेख: ट्रैफ़िक का 77%, AI प्रदर्शन मेट्रिक्स सामग्री को भारी रूप से लक्षित करता है
- robots.txt: 71 अनुरोध (स्थिर 1-4/दिन)
- इमेज: 18 अनुरोध (लेख-विशिष्ट इमेज)
- Sitemap.xml: शून्य। कभी अनुरोध नहीं करता।
- भाषा वेरिएंट: 52.9%, व्यापक बहुभाषी कवरेज
क्रॉल समय: 23:00, 05:00 और 09:00 UTC पर तीन अलग बर्स्ट विंडो।
इन्फ्रास्ट्रक्चर: Amazon Technologies Inc. (96%), केवल US। 13 IPs, मध्यम सांद्रता।
Googlebot
कुल: 816 अनुरोध | IPs: 72
होमपेज-भारी (ट्रैफ़िक का 27%) और सबसे “फुल रेंडर” क्रॉलर। सामग्री के साथ इमेज, CSS, JS लाता है।
यह क्या क्रॉल करता है:
- होमपेज: 220 अनुरोध (27%)
- इमेज: 152 अनुरोध
- CSS: 132 अनुरोध
- JS: 54 अनुरोध
- लेख: 141 अनुरोध
- robots.txt: 68 अनुरोध
- Sitemap.xml: 5 अनुरोध (कभी-कभी)
भाषा वेरिएंट: केवल 10.4%, अन्य बॉट्स की तुलना में काफी कम बहुभाषी।
इन्फ्रास्ट्रक्चर: Google LLC (91%), कुछ Sweden से (8%)। समान 24 घंटे क्रॉल पैटर्न।
Bingbot
कुल: 1,221 अनुरोध | रुझान: फरवरी से मार्च +23% | IPs: 258
सबसे सुसंगत और व्यापक क्रॉलर। साइटमैप का प्रमुख उपभोक्ता भी।
यह क्या क्रॉल करता है:
- लेख: 68% (भारी भाषा वेरिएंट कवरेज के साथ)
- Sitemap.xml: 139 अनुरोध (2-8/दिन, हर दिन), अब तक का सबसे सक्रिय साइटमैप क्रॉलर
- इमेज: 78 अनुरोध (सोशल आइकन, डैशबोर्ड PNGs, लेख इमेज)
- robots.txt: 36 अनुरोध
भाषा वेरिएंट: 60.3%, Dutch (97) और German (98) वेरिएंट पर भारी फोकस।
क्रॉल समय: समान 24 घंटे कवरेज, हमेशा चालू।
Meta-WebIndexer
कुल: 1,833 अनुरोध | रुझान: फरवरी से मार्च +59% | IPs: 156
कुल मिलाकर सबसे अधिक वॉल्यूम वाला बॉट। मुख्य रूप से सामग्री पर केंद्रित, विशेषकर भाषा वेरिएंट।
यह क्या क्रॉल करता है:
- लेख: ट्रैफ़िक का 88%
- भाषा वेरिएंट: 79.8%, अब तक का सबसे आक्रामक बहुभाषी क्रॉलर
- Sitemap.xml: 30 अनुरोध
- robots.txt: शून्य। robots.txt बिल्कुल नहीं जांचता।
क्रॉल समय: शाम/रात्रि भारी, 20:00-21:00 और 00:00-01:00 UTC पर पीक।
इन्फ्रास्ट्रक्चर: Meta Platforms Ireland Ltd ASN, केवल US।
GPTBot की तरह, Meta-WebIndexer robots.txt नहीं जांचता। GPTBot के विपरीत, यह पूरी अवधि में लगातार सक्रिय रहा है।
व्यवहार पैटर्न
robots.txt अनुपालन
| व्यवहार | बॉट्स |
|---|---|
| जुनूनी जांचकर्ता (दिन में कई बार) | OAI-SearchBot (3.8/दिन), ClaudeBot (4/दिन), Claude-SearchBot (4/दिन) |
| नियमित जांचकर्ता (दैनिक या लगभग दैनिक) | PerplexityBot, Googlebot, Applebot, Amazonbot, FacebookExternalHit (घड़ी की तरह ठीक 1/दिन) |
| केवल robots.txt जांचता है, कुछ और नहीं | Bytespider (100%), CCBot (100%) |
| कभी robots.txt नहीं जांचता | GPTBot, Meta-WebIndexer, ChatGPT-User |
GPTBot और Meta-WebIndexer उल्लेखनीय रूप से गैर-अनुपालक बॉट्स हैं। वे बिना नियम जांचे आक्रामक रूप से क्रॉल करते हैं।
साइटमैप खोज
| बॉट | साइटमैप हिट्स | पहला अनुरोध | पैटर्न |
|---|---|---|---|
| Bingbot | 139 | 1 फरवरी | दैनिक, 2-8/दिन (साइटमैप का राजा) |
| Claude-SearchBot | 135 | 25 फरवरी | भारी, दूसरा सबसे सक्रिय बन गया |
| Meta-WebIndexer | 30 | 5 फरवरी | नियमित |
| ClaudeBot | 14 | 18 मार्च | बिल्कुल नया व्यवहार |
| Googlebot | 5 | 2 फरवरी | कभी-कभी |
| GPTBot | 2 | 19 मार्च | बिल्कुल नया व्यवहार |
| Applebot | 1 | 17 मार्च | एकल हिट |
18-19 मार्च एक बदलाव का संकेत है। ClaudeBot और GPTBot दोनों ने पहली बार sitemap.xml का अनुरोध किया, जो Anthropic और OpenAI से एक साथ नई क्रॉल रणनीति लॉन्च का संकेत देता है।
llms.txt / AI-विशिष्ट फ़ाइल अनुरोध
किसी AI बॉट ने /llms.txt या /llm.txt का अनुरोध नहीं किया। GPTBot, ClaudeBot, PerplexityBot या किसी अन्य AI क्रॉलर से शून्य हिट्स।
llms.txt की जांच करने वाला एकमात्र बॉट Dataprovider.com (एक वेब एनालिटिक्स कंपनी) है: फरवरी-मार्च में 3 अनुरोध।
/.well-known/ai-plugin.json के लिए दो अनुरोध Firefox ब्राउज़र से आए, बॉट्स से नहीं।
भाषा वेरिएंट क्रॉलिंग
| बॉट | भाषा वेरिएंट में ट्रैफ़िक का % | कवरेज |
|---|---|---|
| Meta-WebIndexer | 79.8% | सभी 11 भाषाएं, समान रूप से वितरित |
| GPTBot | 61.5% | सभी 11 भाषाएं, प्रत्येक 8-12 |
| Bingbot | 60.3% | सभी 11, Dutch/German पर भारी |
| PerplexityBot | 52.9% | सभी 11, German/Spanish शीर्ष पर |
| Amazonbot | 32.4% | सभी 11 |
| Claude-SearchBot | 23.3% | सभी 11, काफी समान |
| Applebot | 23.0% | सभी 11 |
| OAI-SearchBot | 11.2% | सभी 11 |
| Googlebot | 10.4% | Spanish/Portuguese शीर्ष पर |
| ChatGPT-User | 4.7% | French/Spanish/Italian (उपयोगकर्ता-संचालित) |
Meta-WebIndexer और GPTBot सबसे आक्रामक बहुभाषी क्रॉलर हैं। ChatGPT-User का कम प्रतिशत तर्कसंगत है: यह दर्शाता है कि वास्तविक उपयोगकर्ता किन भाषाओं में पढ़ रहे हैं।
इमेज क्रॉलिंग
| बॉट | इमेज अनुरोध | क्या लाते हैं |
|---|---|---|
| Googlebot | 152 | SVG आइकन, लोगो, फेविकॉन, रेंडरिंग एसेट |
| Google-InspectionTool | 108 | सोशल आइकन, केस स्टडी इमेज |
| Googlebot-Image | 75 | फेविकॉन, लोगो वेरिएंट, लेख इमेज |
| Bingbot | 78 | सोशल आइकन, डैशबोर्ड PNGs, लेख इमेज |
| OAI-SearchBot | 55 | लेख इमेज, लेखक फोटो, स्क्रीनशॉट |
| Applebot | 32 | लेख कवर इमेज |
| GPTBot | 28 | लेख हेडर, लेखक फोटो (सभी 19 मार्च को) |
| PerplexityBot | 18 | लेख इमेज |
| ClaudeBot | 10 | लेखक फोटो, स्क्रीनशॉट (सभी 18 मार्च को) |
| ChatGPT-User | 0 | कभी इमेज नहीं लाता |
Googlebot रेंडरिंग के लिए इमेज लाता है। OAI-SearchBot संभवतः सर्च रिज़ल्ट कार्ड के लिए लाता है। GPTBot और ClaudeBot दोनों ने एक ही दिन केंद्रित इमेज बर्स्ट किए, जो बैच इंडेक्सिंग रन का संकेत देता है।
ChatGPT-User शून्य इमेज लाता है। शुद्ध टेक्स्ट निष्कर्षण।
अन्य उल्लेखनीय बॉट्स की खोज
PromptingBot/1.0.0 (104 अनुरोध)
- Google Cloud इन्फ्रास्ट्रक्चर पर चलता है
- 24 फरवरी से 13 मार्च तक सक्रिय
- पूर्ण पेज रेंडरिंग करता है (CSS, JS, इमेज, सोशल आइकन लाता है)
- AI प्रदर्शन मेट्रिक्स सामग्री को लक्षित करता है
LinkupBot/1.0 (47 अनुरोध)
- linkup.so से, एक वेब इंडेक्सिंग सेवा
- Microsoft इन्फ्रास्ट्रक्चर, मूल: France
- robots.txt जांचता है, फिर माइग्रेशन/रीडायरेक्ट सामग्री पर ध्यान केंद्रित करता है
Brightbot 1.0 (46 अनुरोध)
- truview LLC से, 41 अद्वितीय IPs
- Dutch भाषा वेरिएंट पर ध्यान केंद्रित करता है
Observer/1.0 (36 अनुरोध)
- obsrvr.net से, German/Finnish इन्फ्रास्ट्रक्चर
- केवल robots.txt और एक French लेख क्रॉल करता है
Dataprovider.com (148 अनुरोध)
- कनाडाई वेब एनालिटिक्स कंपनी
- /llms.txt जांचने वाला एकमात्र बॉट (3 बार)
- /ads.txt और /humans.txt भी जांचता है
HTTP मेथड
प्रत्येक बॉट विशेष रूप से GET का उपयोग करता है। सभी 12,099 बॉट अनुरोधों में शून्य HEAD, POST या अन्य मेथड।
देश/ASN डेटा
| बॉट | प्राथमिक ASN | देश |
|---|---|---|
| GPTBot | Microsoft Limited | केवल US |
| OAI-SearchBot | Microsoft Limited (87%) + Microsoft Corp (13%) | केवल US |
| ChatGPT-User | Microsoft Corporation (78%) | US (50%), Poland (16%), Australia (5%), Spain (5%), Japan (5%), Brazil (4%), 15 देश |
| ClaudeBot | Anthropic, PBC (97%) | केवल US |
| Claude-SearchBot | Anthropic, PBC (100%) | केवल US |
| Claude-User | Google LLC (100%) | केवल US |
| PerplexityBot | Amazon Technologies Inc. (96%) | केवल US |
| Amazonbot | Amazon (100%) | केवल US |
| Applebot | Apple Inc. (100%) | केवल US |
| Bingbot | Microsoft Corporation (99.7%) | केवल US |
| Googlebot | Google LLC (91%) | US (92%), Sweden (8%) |
| Meta-WebIndexer | Meta Platforms Ireland Ltd (100%) | केवल US |
| Bytespider | Amazon Singapore (53%), China Unicom (47%) | Singapore (53%), China (47%) |
Bytespider (Singapore/China) को छोड़कर सभी प्रमुख AI बॉट्स US इन्फ्रास्ट्रक्चर से चलते हैं। ChatGPT-User एकमात्र बॉट है जिसका वास्तव में वैश्विक वितरण है, जो इसके मानव उपयोगकर्ता आधार को दर्शाता है।
अक्सर पूछे जाने वाले प्रश्न
2026 में कौन से AI बॉट्स वेबसाइटों पर सबसे अधिक बार आ रहे हैं?
wislr.com के 48 दिनों के सर्वर लॉग डेटा के आधार पर, सबसे अधिक वॉल्यूम वाले AI बॉट्स हैं: Meta-WebIndexer (1,833 अनुरोध), ChatGPT-User (923 अनुरोध), Claude-SearchBot (549 अनुरोध), Applebot (495 अनुरोध), PerplexityBot (456 अनुरोध), OAI-SearchBot (330 अनुरोध), ClaudeBot (206 अनुरोध), और GPTBot (187 अनुरोध)। ChatGPT-User ने फरवरी और मार्च 2026 के बीच +201% की सबसे तेज वृद्धि दिखाई।
क्या AI बॉट्स क्रॉलिंग से पहले robots.txt जांचते हैं?
यह काफी भिन्न होता है। OAI-SearchBot बिना किसी अपवाद के प्रतिदिन 3-6 बार robots.txt जांचता है। ClaudeBot और Claude-SearchBot औसतन प्रतिदिन 4 बार जांचते हैं। Bytespider और CCBot केवल robots.txt जांचते हैं और कोई वास्तविक सामग्री क्रॉल नहीं करते। हालांकि, GPTBot और Meta-WebIndexer सबसे सक्रिय क्रॉलर्स होने के बावजूद कभी robots.txt नहीं जांचते। ChatGPT-User भी कभी robots.txt नहीं जांचता।
क्या कोई AI बॉट llms.txt का अनुरोध करता है?
नहीं। 48 दिनों में 12,099 बॉट अनुरोधों में से शून्य AI बॉट्स ने /llms.txt या /llm.txt का अनुरोध किया। llms.txt की जांच करने वाला एकमात्र बॉट Dataprovider.com था, जो एक वेब एनालिटिक्स कंपनी है, AI प्लेटफॉर्म नहीं। llms.txt को एक मानक के रूप में बढ़ती चर्चा के बावजूद, वर्तमान में कोई AI क्रॉलर व्यवहार में इसे नहीं खोजता।
GPTBot और ChatGPT-User में क्या अंतर है?
GPTBot, OpenAI का प्रशिक्षण और इंडेक्सिंग क्रॉलर है जो व्यवस्थित रूप से पेज, भाषा वेरिएंट और इमेज को केंद्रित बर्स्ट में क्रॉल करता है, अक्सर robots.txt जांचे बिना। ChatGPT-User तब सक्रिय होता है जब कोई वास्तविक व्यक्ति ChatGPT वार्तालाप में URL पेस्ट करता है। ChatGPT-User के 923 अनुरोधों के लिए 584 अद्वितीय IPs थे (लगभग 1:1), जो व्यक्तिगत उपयोगकर्ता सत्रों की पुष्टि करता है। ChatGPT-User केवल HTML टेक्स्ट लाता है, कभी इमेज, CSS या JS नहीं। GPTBot सभी प्रकार की फाइलें लाता है।
आप अपनी वेबसाइट पर AI बॉट ट्रैफ़िक का पता कैसे लगा सकते हैं?
AI बॉट ट्रैफ़िक Google Analytics जैसे क्लाइंट-साइड एनालिटिक्स टूल्स के लिए अदृश्य है क्योंकि बॉट्स JavaScript निष्पादित नहीं करते। आपको सर्वर-साइड रिक्वेस्ट लॉगिंग की आवश्यकता है जो आपके डोमेन पर आने वाले कच्चे HTTP अनुरोधों को कैप्चर करे, जिसमें User-Agent हेडर शामिल है जो GPTBot, ChatGPT-User, ClaudeBot और अन्य बॉट्स की पहचान करता है। WISLR AI Visibility Dashboard यह स्तर की दृश्यता बिल्ट-इन प्रदान करता है।
कौन से AI बॉट्स बहुभाषी सामग्री को सबसे आक्रामक रूप से क्रॉल करते हैं?
Meta-WebIndexer अपने क्रॉल बजट का 79.8% भाषा वेरिएंट पर खर्च करता है, जो इसे सबसे आक्रामक बहुभाषी क्रॉलर बनाता है। GPTBot 61.5% के साथ दूसरे स्थान पर है, जो लेखों के सभी 11 भाषा संस्करण क्रॉल करता है। Bingbot (60.3%) और PerplexityBot (52.9%) भी बहुभाषी सामग्री को भारी मात्रा में लक्षित करते हैं। Googlebot केवल 10.4% के साथ उल्लेखनीय रूप से कम बहुभाषी है। ChatGPT-User की कम 4.7% दर दर्शाती है कि यह मानव उपयोगकर्ताओं द्वारा संचालित है, स्वचालित क्रॉलिंग द्वारा नहीं।