Skip to main content

Los bots rastreando la pila agéntica de Shopify.

Dos meses de registros de borde de una tienda Shopify de investigación. Microsoft Copilot es el único verificador agéntico orgánico que sondea por su cuenta, accediendo a /.well-known/ucp desde Azure first-party semana tras semana. Los rastreadores LLM comunes (GPTBot, ClaudeBot, Bingbot, Googlebot) siguen recuperando la ruta canónica de Shopify /pages/llms-txt e ignoran cada archivo más nuevo de descubrimiento de agentes.

Conclusiones clave
  1. Microsoft Copilot está sondeando por su cuenta el manifiesto UCP.
    Microsoft-Commerce-Platform sondea /.well-known/ucp aproximadamente cada semana desde Microsoft Azure.
    Microsoft-Commerce-Platform es el pipeline de ingesta UCP de Microsoft Copilot.
  2. Los bots IA aún no están usando los archivos más nuevos de descubrimiento de agentes. Ninguno de los rastreadores LLM comunes (GPTBot, ClaudeBot, Bingbot, Googlebot) ha accedido aún a ninguna de las rutas más nuevas de descubrimiento de agentes: /llms-full.txt, /agents.md o /sitemap_agentic_discovery.xml. Todos siguen recuperando en su lugar la ruta canónica de Shopify /pages/llms-txt.
  3. Google-Extended no ha visitado la tienda ni una sola vez. El bot declarado de exclusión de entrenamiento IA de Google registró cero visitas en los últimos 60 días, en cualquier ruta. Si Gemini está extrayendo datos de productos de Shopify hacia su pipeline de entrenamiento, no lo está haciendo bajo este UA. Los bots de Google que sí aparecieron (Googlebot, GoogleOther) son rastreadores de búsqueda y compras, no el bot de datos de entrenamiento.

Quién está ahí, y qué van a buscar.

Total de recuperaciones de bots LLM a lo largo del periodo, junto con un mapa de calor bot por endpoint. GPTBot, ClaudeBot y Bingbot recuperan dos veces /pages/llms-txt y /a/llms pero ignoran los archivos de la nueva especificación. Solo Microsoft-Commerce-Platform sondea /.well-known/ucp por su cuenta.

Total de recuperaciones por operador en 60 días

Todos los recursos de descubrimiento LLM combinados
BingbotLLM
93
GPTBotLLM
71
ClaudeBotLLM
28
AmazonbotLLM
13
GoogleOtherLLM
5
OAI-SearchBotLLM
4
Meta-ExternalLLM
3
GooglebotLLM
3
MS-CommerceVRF
3
ApplebotLLM
2
Google-ExtendedLLM
0

Bot × endpoint, 60 días

Celdas vacías = cero visitas. /[locale]/llms-txt agrupa las variantes con prefijo de localización que Shopify autogenera para cada región habilitada, p. ej. /en-gb/pages/llms-txt.
  /pages/llms-txt /a/llms /[locale]/llms-txt /llms.txt /llms-full.txt /agents.md /sitemap_agentic /.well-known/ucp
BingbotLLM 50 43 ······
GPTBotLLM 34 31 6 ·····
ClaudeBotLLM 14 14 ······
AmazonbotLLM 13 ·······
GoogleOtherLLM 1 · 4 ·····
OAI-SearchBotLLM 4 ·······
GooglebotLLM 2 · 1 ·····
Meta-ExternalLLM 2 1 ······
MS-CommerceVRF ······· 3
ApplebotLLM 1 1 ······
Google-ExtendedLLM ········

El único verificador agéntico orgánico que detectamos: Microsoft Copilot.

Microsoft-Commerce-Platform sondeó /.well-known/ucp con una cadencia aproximadamente semanal desde el espacio Azure first-party de Microsoft. La IP, el ASN, los registros PTR y la convención de nombres coinciden con Microsoft directamente.

Microsoft-Commerce -Platform
User-Agent: Microsoft-Commerce-Platform/1.0
IPs
Tres IPs en 4.149.255.0/24
ASN
AS8075 · Microsoft · Azure first-party
Geo
Washington · Seattle / Redmond
CF colo
SEA
DNS inverso
PTRs gestionados por Microsoft
Total reqs
3 · solo /.well-known/ucp
Cadencia
~semanal
Evidencia conductual
  • ASN Azure first-party de Microsoft (AS8075).
  • Tres IPs en el contiguo 4.149.255.0/24. Patrón de poller de producción.
  • Toca únicamente /.well-known/ucp. Sin barrido de preparación.
  • Cadencia aproximadamente semanal coherente con sondeo de actualización de capacidades.
  • El UA se llama "Commerce-Platform", coincidiendo con la línea de producto propia de Microsoft.

El pipeline de ingesta UCP de Microsoft Copilot. Microsoft adoptó UCP en NRF 2026 y entrega UCP en Copilot Checkout con Shopify, PayPal y Stripe. El sondeo semanal desde Azure first-party es la actualización de capacidades en producción, no una sonda puntual.