Skip to main content

Die Bots, die Shopifys Agentic-Stack crawlen.

Zwei Monate Edge-Logs aus einem Shopify-Forschungs-Storefront. Microsoft Copilot ist der einzige organische agentische Verifier, der eigenständig pollt und /.well-known/ucp Woche für Woche aus First-Party-Azure-Adressen abruft. Die verbreiteten LLM-Crawler (GPTBot, ClaudeBot, Bingbot, Googlebot) holen weiterhin den Shopify-kanonischen Pfad /pages/llms-txt ab und ignorieren jede neuere Agent-Discovery-Datei.

Zentrale Erkenntnisse
  1. Microsoft Copilot pollt eigenständig nach dem UCP-Manifest.
    Microsoft-Commerce-Platform pollt /.well-known/ucp etwa wöchentlich aus Microsoft Azure.
    Microsoft-Commerce-Platform ist die UCP-Ingestion-Pipeline von Microsoft Copilot.
  2. KI-Bots nutzen die neueren Agent-Discovery-Dateien noch nicht. Keiner der verbreiteten LLM-Crawler (GPTBot, ClaudeBot, Bingbot, Googlebot) hat bisher einen der neueren Agent-Discovery-Pfade getroffen: /llms-full.txt, /agents.md oder /sitemap_agentic_discovery.xml. Sie alle holen weiterhin den Shopify-kanonischen Pfad /pages/llms-txt stattdessen ab.
  3. Google-Extended hat den Storefront kein einziges Mal besucht. Googles erklärter KI-Trainings-Opt-Out-Bot verzeichnete in den letzten 60 Tagen null Hits auf jedem Pfad. Falls Gemini überhaupt Shopify-Produktdaten in seine Trainings-Pipeline einspeist, geschieht das nicht unter diesem User-Agent. Die Google-Bots, die aufgetaucht sind (Googlebot, GoogleOther), sind Search- und Shopping-Crawler, nicht der Trainingsdaten-Bot.

Wer da ist und worauf sie zielen.

Gesamtzahl der LLM-Bot-Abrufe im Zeitfenster, daneben eine Bot-zu-Endpoint-Heatmap. GPTBot, ClaudeBot und Bingbot rufen /pages/llms-txt und /a/llms doppelt ab, ignorieren aber die neuen Spec-Dateien. Nur Microsoft-Commerce-Platform pollt /.well-known/ucp eigenständig.

Gesamtabrufe pro Operator über 60 Tage

Alle LLM-Discovery-Ressourcen kombiniert
BingbotLLM
93
GPTBotLLM
71
ClaudeBotLLM
28
AmazonbotLLM
13
GoogleOtherLLM
5
OAI-SearchBotLLM
4
Meta-ExternalLLM
3
GooglebotLLM
3
MS-CommerceVRF
3
ApplebotLLM
2
Google-ExtendedLLM
0

Bot × Endpoint, 60 Tage

Leere Zellen = null Hits. /[locale]/llms-txt aggregiert die länderpräfixierten Varianten, die Shopify automatisch für jede aktivierte Region generiert, z. B. /en-gb/pages/llms-txt.
  /pages/llms-txt /a/llms /[locale]/llms-txt /llms.txt /llms-full.txt /agents.md /sitemap_agentic /.well-known/ucp
BingbotLLM 50 43 ······
GPTBotLLM 34 31 6 ·····
ClaudeBotLLM 14 14 ······
AmazonbotLLM 13 ·······
GoogleOtherLLM 1 · 4 ·····
OAI-SearchBotLLM 4 ·······
GooglebotLLM 2 · 1 ·····
Meta-ExternalLLM 2 1 ······
MS-CommerceVRF ······· 3
ApplebotLLM 1 1 ······
Google-ExtendedLLM ········

Der einzige organische agentische Verifier, den wir erwischt haben: Microsoft Copilot.

Microsoft-Commerce-Platform hat /.well-known/ucp in einem etwa wöchentlichen Rhythmus aus Microsofts First-Party-Azure-Bereich gepollt. IP, ASN, PTR-Einträge und Namenskonvention passen alle direkt zu Microsoft.

Microsoft-Commerce -Platform
User-Agent: Microsoft-Commerce-Platform/1.0
IPs
Drei IPs in 4.149.255.0/24
ASN
AS8075 · Microsoft · First-Party Azure
Geo
Washington · Seattle / Redmond
CF colo
SEA
Reverse DNS
Von Microsoft verwaltete PTRs
Anfragen gesamt
3 · nur /.well-known/ucp
Frequenz
~wöchentlich
Verhaltensbeleg
  • Microsofts First-Party-Azure-ASN (AS8075).
  • Drei IPs in zusammenhängendem 4.149.255.0/24. Muster eines produktiven Pollers.
  • Trifft nur /.well-known/ucp. Kein Readiness-Durchlauf.
  • Etwa wöchentliche Frequenz, konsistent mit Capability-Refresh-Polling.
  • Der User-Agent heißt "Commerce-Platform" und passt zu Microsofts eigener Produktlinie.

Die UCP-Ingestion-Pipeline von Microsoft Copilot. Microsoft hat UCP auf der NRF 2026 übernommen und liefert UCP in Copilot Checkout zusammen mit Shopify, PayPal und Stripe aus. Der wöchentliche Poll aus First-Party-Azure ist der produktive Capability-Refresh, kein einmaliger Probe.