Pemantauan trafik LLM: tiga isyarat (latihan, petikan, rujukan)

Trafik LLM dipecahkan kepada tiga isyarat di tapak: rangkak latihan, petikan perbualan, dan rujukan pengguna sebenar. Pengukuran sebelah pelayan, liputan kandungan sebagai pengindeksan era LLM, dan bagaimana petikan dibandingkan dengan Share of Voice.

Available in:

English Deutsch Español Français हिन्दी Italiano Nederlands Polski Português Türkçe Українська

Author: Tony Castillo

Published May 1, 2026

← All articles

Tiga isyarat trafik LLM: rangkak latihan, petikan perbualan, dan rujukan pengguna sebenar, dengan liputan kandungan sebagai pintu hulu

Apa sebenarnya trafik LLM

Trafik LLM sering dibincangkan sebagai satu nombor, dan rangka kerja tersebut meninggalkan banyak di atas meja. Di tapak anda sendiri, aktiviti AI sebenarnya muncul sebagai tiga isyarat berbeza yang anda boleh ukur secara langsung, setiap satu dihasilkan oleh jenis tingkah laku AI yang berbeza dan setiap satu menunjuk ke kerja yang berbeza. Isyarat keempat, Share of Voice, diukur di luar tapak. Ia adalah dimensi prestasi yang kurang boleh dipercayai, tetapi ia adalah pendekatan yang kebanyakan pasukan gunakan pada masa ini untuk pandangan luar tapak. Memandangkan pasukan memberi tumpuan kepada pertumbuhan saluran AI, kami percaya jenama harus berorientasi mengikut model tiga isyarat ini untuk mengukur prestasi.

3 isyarat

Rangkak latihan, petikan perbualan, dan rujukan pengguna sebenar, setiap satu boleh diukur secara berasingan

WISLR AI Channel Analytics

Isyarat 1 · Masa latihan

Latihan LLM

OpenAI, Anthropic, Google dan Common Crawl menarik halaman anda untuk memberi makan latihan model. Tiada pengguna langsung. Model sedang belajar apa yang perlu diketahui tentang jenama dan kandungan anda.

Isyarat 2 · Perbualan langsung

Petikan perbualan

ChatGPT, Claude, dan Perplexity menarik halaman anda di tengah-tengah perbualan untuk menjawab soalan yang seseorang tanya sekarang. Setiap pengambilan ialah momen niat langsung.

Isyarat 3 · Niat tinggi

Pengguna sebenar

Seseorang mengklik petikan dari ChatGPT, Claude, Perplexity, atau Copilot dan mendarat di tapak anda. Mereka tiba selepas menyelidik soalan, jadi mereka menukar pada kadar yang lebih tinggi daripada saluran lain.

Setiap isyarat berbaloi untuk dijejak secara berasingan, disusun mengikut tempat pengguna berada apabila setiap satu berlaku: masa latihan sebelum mana-mana pengguna terlibat, perbualan langsung di mana pengguna sedang bertanya soalan sekarang, dan klik di mana pengguna berada di tapak anda. Model tiga isyarat ini menangkap bagaimana AI sebenarnya berinteraksi dengan tapak, iaitu apa yang penerbit dan operator e-dagang perlukan untuk membuat keputusan. Kami telah membina AI Channel Analytics berdasarkan model yang sama.

Sebaik sahaja anda berfikir dalam tiga isyarat dan bukannya satu nombor, soalan yang pasukan paling kerap tanya, bagaimana untuk memantau trafik LLM, apa yang dimiliki papan pemuka, dan nombor mana yang paling berguna, menjadi lebih mudah untuk dijawab.

Mengapa GA4 dan alat analitik sebelah pelanggan lain mengalami kesukaran dengan ini

Sebelum kita masuk ke isyarat, satu kata cepat tentang apa yang alat analitik sedia ada boleh dan tidak boleh tunjukkan. GA4 adalah alat dominan, dan ia mempunyai had yang terkenal apabila ia berkaitan dengan trafik AI. Had yang sama digunakan untuk Adobe Analytics, Mixpanel, Amplitude, Heap, Plausible, Fathom, Matomo dan mana-mana alat lain yang bergantung pada tag JavaScript yang dicetuskan dalam pelayar sebenar. Sebabnya adalah seni bina berbanding boleh dikonfigurasi, jadi mencuba alat lain cenderung membawa anda ke tempat yang sama.

Kami telah meliputi gambaran lengkap untuk GA4 secara khusus dalam Trafik LLM ialah titik buta dalam analitik anda, jadi inilah versi pendek. Setiap isyarat berinteraksi dengan analitik sebelah pelanggan secara berbeza.

Rangkak latihan tidak kelihatan kerana bot tidak melaksanakan JavaScript. Pengambilan latihan OpenAI, Anthropic, dan Google AI tidak mencetuskan tag sebelah pelanggan secara reka bentuk. GA4, Adobe, Mixpanel, Amplitude, Heap dan alat mengutamakan privasi seperti Plausible dan Fathom semuanya berkongsi jurang ini kerana tiada satu pun daripada mereka melog permintaan melainkan pelayar menjalankan tag mereka.
Petikan perbualan berlaku sepenuhnya di luar tapak anda. AI menarik halaman anda di sebelah pelayan bagi pihak pengguna dan memaparkan jawapan dalam sembang. Tiada pelayar dibuka, tiada peristiwa analitik dipicu, jadi aktiviti ini tidak muncul dalam mana-mana alat sebelah pelanggan.
Rujukan pengguna sebenar sebahagiannya kelihatan merentasi setiap alat sebelah pelanggan, tetapi biasanya kurang dikira sebanyak 2,5x hingga 5x. Apl mudah alih LLM memaparkan pautan keluar dalam WebView terpencil yang menanggalkan perujuk. Gemini dan Claude tidak menghantar isyarat atribusi pada kebanyakan platform yang diuji. Gambaran Keseluruhan AI Google dikumpulkan di bawah carian organik, yang menjadikannya sukar untuk dipisahkan. Pengumpulan yang sama muncul dengan cara yang sama sama ada laporan yang anda baca berada dalam GA4, Adobe, atau alternatif mengutamakan privasi.

2,5 hingga 5x

Pengiraan kurang GA4 sesi yang dirujuk LLM berbanding kebenaran asas sebelah pelayan, berdasarkan ujian langsung merentasi senario mudah alih dan desktop.

Ujian peranti demi peranti WISLR

Penyelesaiannya bukanlah tag yang lebih baik, strategi UTM yang lebih bersih, atau bertukar kepada alat sebelah pelanggan yang berbeza. Penyelesaiannya ialah tangkapan sebelah pelayan di pinggir, diklasifikasikan mengikut ejen pengguna, julat IP yang disahkan, dan DNS terbalik, dan dijahit bersama setiap permukaan AI. Itulah satu-satunya cara untuk melihat ketiga-tiga isyarat sekaligus, dan ia adalah bebas daripada mana-mana alat analitik sebelah pelanggan yang anda terus jalankan untuk trafik anda yang lain.

Isyarat 1: Latihan LLM

Latihan LLM ialah AI membaca jenama dan kandungan anda untuk memberi makan versi seterusnya modelnya. Perangkak latihan dari OpenAI, Anthropic, Google, Common Crawl, dan ByteDance menarik halaman anda pada jadual berterusan, mencerna kandungan, dan menggulungnya ke dalam kitaran latihan seterusnya. Ini adalah asas setiap interaksi seterusnya. Jika model tidak menyerap halaman anda, ia tidak boleh menyebut anda, tidak boleh mengesyorkan produk anda, dan tidak boleh menghantar pengguna kepada anda.

Ini juga ialah isyarat yang GA4 dan setiap alat analitik sebelah pelanggan lain mempunyai keterlihatan sifar. Rangkak latihan hanya kelihatan dalam log permintaan sebelah pelayan anda.

Rangkak latihan AI kini berada pada skala enjin carian

Konteks volum yang kebanyakan pasukan terlepas: Volum rangkak latihan AI di tapak kandungan-kaya yang biasa kini bersaing dengan volum rangkak dari enjin carian terkemuka. Perangkak latihan OpenAI, Anthropic, Google, Common Crawl, dan ByteDance bersama-sama menghasilkan volum permintaan pada urutan magnitud yang sama dengan Google Search dan Bing digabungkan. Pada banyak tapak, pengambilan latihan AI sudah melebihi pengambilan enjin carian dalam kekerapan.

~1:1

Nisbah volum rangkak latihan AI kepada volum rangkak enjin carian terkemuka di tapak kandungan-kaya yang biasa. AI tiba pada keamatan yang sama seperti Google Search selama dua puluh tahun yang lalu.

Log pelayan klien WISLR

Ini bukan lagi isyarat kecil atau saluran sampingan. Perangkak yang menentukan apa yang alat AI tahu tentang jenama anda tiba pada keamatan yang sama dengan perangkak yang menentukan apa yang Google Search tahu tentang jenama anda selama dua puluh tahun yang lalu.

Apa yang perlu dilihat

Dengan penjejakan yang betul disediakan, isyarat latihan dipecahkan merentasi beberapa dimensi yang penting untuk tindakan:

Volum harian mengikut enjin AI dalam tetingkap bergulir 30 hari dan sepanjang masa.
Liputan latihan sebagai peratusan halaman bernilai tinggi di tapak anda, dipecahkan mengikut bahagian.
Halaman paling diambil dengan pautan keluar, kekerapan menyegarkan, dan permukaan AI mana yang menariknya.
Ringkasan jenis halaman supaya anda boleh melihat sekilas sama ada AI membaca halaman produk anda, halaman kategori anda, artikel anda, atau ketiga-tiganya.
Pecahan enjin AI. OpenAI mungkin menguasai sementara latihan AI Google senyap; Anthropic mungkin kekal pada blog anda sementara Common Crawl meliputi katalog.
Jenis media. Ini ialah dimensi yang kebanyakan pasukan lupa. Lebih banyak mengenainya seterusnya.

Media sebagai data latihan: melangkaui badan artikel

Jurang terbesar dalam pemikiran kebanyakan pasukan ialah latihan bukan sahaja teks. Bot AI juga menarik imej, video, dan audio anda. Setiap satu adalah permukaan latihan yang berasingan, dan setiap satu membawa nilai isyarat yang berbeza.

Dengan penjejakan yang lebih baik disediakan, anda boleh membezakan halaman daripada media bukan halaman untuk melihat apa yang setiap enjin AI sebenarnya menggunakan:

Jenis kandungan	Apa yang diserap	Mengapa ia penting
Halaman	Salinan badan, tajuk, pautan dalaman, skema dalam halaman	Sejauh ini bahagian terbesar volum latihan pada kebanyakan tapak.
Imej	Fail imej itu sendiri	Mempengaruhi sama ada produk anda muncul dalam jawapan visual. Teks alt dan kapsyen diserap melalui pengambilan halaman, bukan pengambilan imej.
Video	Fail video itu sendiri	Semakin kerap diambil apabila model multimodal menjadi biasa. Transkrip dan kapsyen diserap melalui pengambilan halaman, bukan pengambilan video.
Audio	Fail audio itu sendiri	Titik buta untuk kebanyakan penerbit; bahan latihan yang kaya. Nota rancangan dan transkrip diserap melalui pengambilan halaman, bukan pengambilan audio.

Implikasi praktikal: teks alt anda, transkrip anda, dan skema dalam halaman anda bukan lagi hanya kebersihan SEO. Ia adalah input latihan. Semakin jelas ia, semakin tepat model mewakili jenama dan kandungan anda kepada pengguna masa hadapan. Sisi Shopify cerita ini, di mana suapan produk dan data berstruktur menjadi permukaan latihan, dilindungi dalam Pelan Agentik Shopify: Data Produk Di Luar Kawalan Anda.

KPI yang penting

Jejak ini sebaliknya

Volum rangkak latihan disahkan setiap enjin AI

Contoh

OpenAI248K Anthropic142K Google91K

30 hari yang lalu

Jejak ini sebaliknya

Kekerapan pengambilan sebenar pada URL teratas anda

Contoh

/guides/wide-feet-running412 / mgg /products/widefeet-pro184 / mgg /guides/best-trail-runners96 / mgg

Jejak ini sebaliknya

Kadens rangkak semula dan peratusan liputan mengikut bahagian

Contoh

/articles/ Liputan bahagian94% Dirangkak semula setiap4 hari /products/ Liputan bahagian78% Dirangkak semula setiap11 hari

Jejak ini sebaliknya

Keutamaan jenis halaman (bahagian mana yang AI baca paling banyak)

Contoh

Artikel48% rangkak Produk31% rangkak Kategori21% rangkak

Soalan yang betul untuk isyarat latihan bukanlah “berapa banyak kita dirangkak” tetapi “adakah kandungan yang betul dirangkak, cukup kerap, oleh enjin AI yang penting”. Metodologi untuk pergi dari log mentah kepada soalan tersebut ada dalam Tingkah Laku Bot AI: Metodologi Analisis Log.

Isyarat 2: Petikan perbualan, lapisan masa nyata

Petikan perbualan ialah AI menarik halaman anda di tengah-tengah sembang untuk menjawab soalan langsung pengguna. Ini ialah pengambilan langsung dari ChatGPT, Claude, dan Perplexity. Setiap pengambilan adalah, mengikut takrifan, momen di mana seseorang bertanya soalan dan model memutuskan halaman anda adalah jawapan terbaik. Ini ialah isyarat niat tertinggi daripada tiga isyarat kerana soalan sedang dijawab sekarang.

Ia juga ialah isyarat yang membuktikan kandungan mana yang sebenarnya gred rujukan dalam pandangan AI. Latihan memberitahu anda apa yang diserap. Petikan memberitahu anda apa yang digunakan.

Apa yang perlu dilihat

Isyarat petikan dipecahkan sepanjang dimensi yang sama dengan isyarat latihan, tetapi makna setiap satu beralih:

Volum harian pengambilan langsung setiap pembantu. Lonjakan pada halaman tertentu sering berkaitan dengan kitaran berita topikal atau soalan perbandingan baru yang ditanya secara meluas.
Liputan petikan, bahagian kandungan gred rujukan anda yang telah diambil sekurang-kurangnya sekali dalam tetingkap terakhir.
Halaman paling diambil dengan pembantu yang mengambilnya. Kejutan di sini adalah peraturan, bukan pengecualian. Halaman yang AI sebut jarang adalah halaman yang anda jangkakan.
Pecahan permukaan AI. Pembantu yang berbeza mengutamakan kandungan yang berbeza. ChatGPT dan Perplexity cenderung memilih kandungan produk dan rujukan berstruktur; Claude cenderung memilih penulisan ekspositori bentuk panjang.
Jenis media. Pengambilan petikan langsung kebanyakannya halaman; imej dan video disebut kurang kerap tetapi semakin meningkat apabila jawapan multimodal menjadi biasa.

Mengapa isyarat ini bernilai unik

Petikan langsung adalah perkara yang paling hampir kepada undi keyakinan yang ekosistem AI hasilkan. Ia adalah model yang berkata, di hadapan pengguna sebenar, “halaman ini ialah sumber yang betul untuk soalan ini”. Jika anda hanya menjejak satu isyarat, ini adalah satunya.

Tangkapannya ialah tiada satu pun daripada itu kelihatan kepada GA4 atau alat sebelah pelanggan, kerana pengambilan berlaku di sebelah pelayan dan pengguna tidak pernah mendarat di halaman anda. Satu-satunya cara untuk melihat petikan ialah di pinggir.

Share of Voice ialah alternatif luar tapak yang kebanyakan pasukan gunakan pada masa ini apabila mereka tidak dapat melihat petikan sebelah pelayan. Ia adalah pengukuran kekerapan jenama anda muncul dalam jawapan AI dalam bakul gesaan perwakilan. Kategori alat yang semakin berkembang, termasuk Profound, Otterly, Peec, Evertune, AthenaHQ, BrandRank.AI, Ahrefs Brand Radar, dan modul AI dalam Semrush dan BrightEdge, menanyakan ChatGPT, Claude, Gemini, dan Perplexity pada skala, mengira sebutan jenama, dan melaporkan bahagian relatif kepada set persaingan.

Ia adalah isyarat arahan yang berguna, tetapi keutamaan kami untuk mengukur prestasi saluran AI ialah isyarat petikan di atas, kerana ia menangkap pengambilan sebenar pada tahap halaman oleh permukaan yang melakukan pengambilan. SOV mempunyai titik buta struktural yang petikan tidak ada.

SOV adalah probabilistik, petikan diperhatikan. Model AI memberi jawapan yang berbeza kepada gesaan yang sama bergantung pada tetapan suhu, konteks perbualan, dan masa hari. Jalankan pertanyaan yang sama dua kali dan anda boleh mendapat dua set sebutan jenama yang berbeza. Alat SOV mengurangkan ini dengan persampelan dan purata, tetapi turun naik asas adalah sebenar, dan ketepatan mana-mana nombor tunggal lebih rendah daripada apa yang dicadangkan oleh kebanyakan laporan. Data petikan, sebaliknya, ialah log pelayan pengambilan sebenar: setiap satu berlaku, dan setiap satu boleh dikira.

SOV mengambil sampel gesaan; petikan diikat pada perbualan sebenar. Alat SOV menjalankan bakul gesaan yang dipilih oleh penganalisis. Pengguna sebenar bertanya soalan yang berbeza, dengan cara yang berbeza, dengan konteks sebelumnya yang berbeza. Sampel mungkin atau mungkin tidak sepadan dengan apa yang pelanggan anda sebenarnya tanya, dan kebanyakan alat tidak menjadikan set gesaan mereka telus. Petikan langsung, mengikut takrifan, datang dari pengguna sebenar yang bertanya soalan sebenar, jadi tiada bias persampelan.

Model berubah. Setiap pelepasan model baru, pelarasan gesaan sistem, atau perubahan pengambilan semula mengalihkan apa yang disebut. Angka SOV yang diukur terhadap model suku tahun lalu adalah pengukuran yang berbeza daripada yang diambil terhadap model suku tahun ini, dan kebanyakan alat tidak telus mengenai versi model dalam laporan mereka. Aktiviti petikan menyesuaikan diri dalam masa nyata kerana ia ditangkap secara langsung daripada pengambilan, tanpa lapisan inferens di antara.

Cara terbersih untuk menggunakan SOV ialah bersama-sama dengan isyarat petikan, bukan sebagai pengganti. SOV ialah penanda aras arahan, luar tapak tentang kekerapan jenama anda muncul dalam jawapan. Petikan ialah rekod yang disahkan, dalam tapak tentang halaman mana yang AI sebenarnya menggunakan untuk menghasilkannya. Digunakan bersama-sama, simulasi luar tapak dan kebenaran dalam tapak memberikan gambaran yang lebih lengkap daripada salah satu sahaja.

KPI yang penting

Jejak ini sebaliknya

Pengambilan petikan disahkan setiap halaman, setiap pembantu

Contoh

Halaman /guides/wide-feet

ChatGPT184 Perplexity92

30 hari yang lalu

Jejak ini sebaliknya

Kekerapan petikan pada halaman rujukan teratas anda

Contoh

/guides/agentic-commerce-10162 / mgg /guides/wide-feet-running38 / mgg /compare/perplexity-vs-chatgpt26 / mgg

Jejak ini sebaliknya

Bahagian petikan mengikut pembantu, trend mingguan

Contoh

ChatGPT62%+4 mata Perplexity24%-1 mata Claude14%stabil

Minggu ke minggu

Jejak ini sebaliknya

Tumpuan petikan mengikut jenis halaman

Contoh

Panduan perbandingan52% petikan Artikel28% petikan Ulasan14% petikan Lain-lain6% petikan

Corak biasa, diambil daripada pelaksanaan penerbit dan e-dagang sebenar: set kecil halaman evergreen menghasilkan sebahagian besar petikan, sementara halaman utama jarang sampai ke 50 teratas. Jika model telah memutuskan bahawa panduan perbandingan mendalam anda adalah jawapan yang betul untuk soalan, ia akan menarik halaman tersebut beratus-ratus kali seminggu dan bukan halaman utama anda sama sekali. Itulah isyarat operasi yang anda mahu.

Isyarat 3: Pengguna sebenar, rujukan niat tinggi

Enjin AI ialah enjin penyelidikan, bukan saluran gangguan. Pengguna yang mengklik petikan dalam ChatGPT, Claude, Perplexity atau Copilot telah pun bertanya soalan mereka, menilai jawapan, dan memilih halaman anda sebagai langkah seterusnya. Pada masa mereka mendarat di tapak anda, mereka lebih jauh ke bawah lengkung pertimbangan berbanding pengguna dari mana-mana saluran yang mengganggu mereka. Merentasi pelaksanaan kami, itu diterjemahkan kepada kadar penukaran yang lebih tinggi dan tetingkap pertimbangan yang lebih pendek berbanding sosial, paparan, dan selalunya carian berbayar. Rangka kerja itu penting kerana pengguna yang dirujuk AI prakelayakan pada masa mereka tiba; untuk konteks perjalanan pembeli yang lebih luas, lihat AI ialah Enjin Penyelidikan, Bukan Saluran Jualan.

Ini juga ialah satu-satunya isyarat yang alat analitik tradisional dapat lihat sama sekali, dan isyarat yang kebanyakan pasukan kembali kepada apabila mereka mendengar “trafik LLM”. Ia juga ialah isyarat di mana jurang WebView dan jurang tanpa-perujuk Gemini/Claude menjadikan GA4 melapor secara kurang sebanyak 2,5 hingga 5 kali, jadi niat tinggi semakin tidak dikira berbanding mana-mana saluran lain di tapak anda.

Apa yang perlu dilihat

Sesi mengikut pembantu sumber, diklasifikasikan di sebelah pelayan dan bukannya bergantung pada pengepala perujuk.
Pengagihan halaman pendaratan. Pengguna yang dirujuk AI cenderung mendarat di halaman yang dalam, bukan halaman utama.
Kadar penukaran mengikut sumber, dibandingkan dengan asas organik anda. Merentasi pelaksanaan kami, penukaran yang dirujuk AI biasanya berjalan lebih tinggi daripada sosial pada asas setiap sesi.
Tetingkap masa-ke-pembelian. Pengguna ChatGPT cenderung untuk menukar pada hari yang sama; pengguna Perplexity selalunya mengambil masa tiga hingga lima hari; Gemini berada di tengah.
Atribusi hasil. Pemadanan IP-ke-pesanan disahkan untuk kes yang paling bersih, pemadanan probabilistik untuk yang lain.

Bagaimana mengukur trafik rujukan dari LLM dalam Google Analytics (jawapan jujur)

Jawapan pendek ialah: anda tidak boleh, sepenuhnya. UTM hadir dari ChatGPT tetapi tidak dari Gemini atau Claude. Perujuk hadir dari pelayar desktop tetapi ditanggalkan pada apl mudah alih. Gambaran Keseluruhan AI muncul di bawah carian organik tanpa keupayaan pemisahan. Anda boleh membina gambaran sebahagian dengan menapis pada utm_source=chatgpt.com dan pada perujuk chatgpt.com, claude.ai, perplexity.ai, gemini.google.com, dan copilot.microsoft.com, tetapi anda akan melihat kira-kira satu perempat daripada trafik sebenar.

Jawapan jujur ialah untuk menangkap isyarat ini di sebelah pelayan. Peta atribusi penuh, dengan setiap ujian peranti demi peranti yang kami jalankan, ada dalam Trafik LLM ialah titik buta dalam analitik anda.

Mudah alih ialah tempat di mana jurang atribusi LLM paling besar

Berikut ialah bahagian pengiraan rujukan yang paling penting: peranti yang kebanyakan khalayak anda gunakan juga ialah peranti di mana atribusi AI paling sukar dilihat dengan jelas. Mudah alih memacu 70 hingga 90 peratus sesi tapak menghadap pengguna, dan ia tempat tinggal apl LLM. Merentasi platform yang kami uji, mudah alih ialah permukaan yang paling kurang dijejak untuk setiap LLM yang penting.

Platform	Permukaan	UTM	Perujuk	Boleh dijejak dalam GA4
ChatGPT	Apl mudah alih	Ya utm_source=chatgpt.com	Tidak	Sebahagian
ChatGPT	Pelayar mudah alih	Ya	Ya	Ya
Gemini	Apl mudah alih	Tidak	Tidak	Tidak
Gemini	Pelayar mudah alih	Tidak	Tidak	Tidak
Claude	Apl mudah alih	Tidak	Tidak	Tidak
Claude	Pelayar mudah alih	Tidak	Tidak	Tidak

Sebab struktural ialah apl mudah alih LLM memaparkan pautan keluar dalam WebView terpencil, yang menanggalkan perujuk dan menanggalkan sesi daripada mana-mana konteks pelayar terdahulu. Pencegahan Penjejakan Pintar iOS WebKit menambah masalah pada iPhone, di mana WebView tertakluk kepada sekatan kuki walaupun penukaran berlaku di dalamnya.

Hasilnya ialah pandangan rujukan sahaja trafik LLM akhirnya kelihatan kebanyakannya seperti pandangan desktop, walaupun khalayak sebenar kebanyakannya mudah alih. Perbandingan silang platform yang diambil daripada nombor GA4 lebih mudah ditafsir apabila jurang mudah alih itu diambil kira. Matriks peranti demi peranti penuh, termasuk senario desktop, ada dalam Trafik LLM ialah titik buta dalam analitik anda.

KPI yang penting

Jejak ini sebaliknya

Kiraan sesi yang dirujuk AI sebelah pelayan

Contoh

Tangkapan sebelah pelayan6,420 sesi Tempoh yang sama dalam GA41,840 sesi

30 hari yang lalu

Jejak ini sebaliknya

Kadar penukaran berbanding asas organik anda

Contoh

AI4.8% Organik2.9% Sosial1.6%

Kadar penukaran setiap sesi

Jejak ini sebaliknya

Pengagihan masa-ke-pembelian setiap sumber

Contoh

ChatGPTHari yang sama Gemini2 hingga 3 hari Perplexity4 hingga 5 hari

Jejak ini sebaliknya

Hasil setiap sesi, setiap pembantu

Contoh

ChatGPT$4.20 Perplexity$7.10 Gemini$3.40

Hasil setiap sesi

Untuk pandangan yang lebih mendalam tentang bagaimana ini sesuai dengan perjalanan pembeli yang lebih luas, lihat AI ialah Enjin Penyelidikan, Bukan Saluran Jualan. Rangka kerja itu penting kerana pengguna yang dirujuk AI sering menjadi penyelidik di pertengahan corong, dan menilai saluran hanya berdasarkan penukaran sesi yang sama akan mengurangkan nilainya.

Dari isyarat ke tindakan: bagaimana data trafik LLM memacu impak

Pengukuran hanya mendapat nilainya apabila ia membawa kepada tindakan. Dengan tiga isyarat dijejak bersama, dua corak cadangan boleh dipercayai muncul dari data merentas isyarat, ditambah log berterusan yang pasukan boleh simpan tentang apa yang telah diusahakan.

Kesegaran kandungan

URL teratas yang dirangkak untuk latihan dalam 30 hari yang lalu, disusun mengikut kekerapan pengambilan. Cadangannya langsung: pastikan ia tepat, kerana model akan belajar apa sahaja yang ada di halaman sekarang dan mewakili jenama anda dengan sewajarnya kepada pengguna masa hadapan. Halaman lapuk yang OpenAI sedang melatih pada waktu malam ialah halaman lapuk yang ChatGPT akan salah mewakili untuk kitaran latihan seterusnya.

Tindakan: semak setiap halaman teratas yang dirangkak dalam kadens berulang, perbetulkan apa-apa yang lapuk, dan simpan rekod tentang apa yang telah disemak dan bila supaya kesegaran menjadi aliran kerja yang dijejak dan bukan audit sekali sahaja.

Halaman dirangkak tetapi tidak disebut

Halaman yang bot latihan AI sedang menarik tetapi yang telah menghasilkan sifar petikan dan sifar rujukan dalam tetingkap yang sama. Dipecahkan kepada Produk dan Kategori untuk e-dagang, kepada jenis artikel untuk penerbit. Ini ialah jurang petikan, dan ia biasanya corak leveraj tertinggi untuk bertindak.

Bot telah membaca halaman. Model tidak memilih untuk menyebutnya. Pembetulannya hampir selalu keluarga perubahan yang sama: tajuk yang lebih jelas, deskripsi yang lebih baik, salinan gaya FAQ, dan JSON-LD yang menamakan produk, khalayak, dan jawapan kepada soalan yang jelas.

Tindakan: tulis semula halaman untuk menjadi lebih boleh disebut, kemudian jejak isyarat petikan pada URL itu dalam dua minggu seterusnya untuk mengesahkan pembetulan.

Peta tindakan merentas isyarat

Setelah anda mempunyai ketiga-tiga isyarat ditangkap, empat corak muncul dan setiap satu menunjuk kepada kerja tertentu. Setiap sel menunjukkan sama ada isyarat itu aktif (halaman muncul di sana), hilang (isyarat tiada), lemah (isyarat ada tetapi berprestasi rendah), atau t/b apabila soalan tidak berkenaan untuk corak.

Latihan	Petikan	Rujukan	Corak	Tindakan
Aktif	Aktif	Aktif	Bintang AI	Lindungi halaman. Pegang tajuk dan salinan stabil, pantau hanyutan, kunci JSON-LD.
Aktif	Hilang	Hilang	Jurang petikan	Tulis semula untuk penggunaan AI: tajuk yang lebih jelas, deskripsi yang lebih baik, salinan gaya FAQ, JSON-LD yang lebih kaya.
Aktif	Aktif	Lemah	Masalah klik	Pembingkaian petikan atau pemuatan halaman kehilangan pengguna. Audit kelajuan halaman, kejelasan hero, dan petikan yang AI sedang menyebut.
Hilang	t/b	t/b	Jurang liputan	Betulkan kebolehjumpaan: robots.txt, peta tapak, pautan dalaman, dan semakan akses setiap enjin.

Inilah yang kami maksudkan dengan “data trafik LLM memacu tindakan”. Apabila tiga isyarat duduk bersebelahan, setiap corak menunjuk kepada jenis kerja tertentu, jadi pasukan boleh mengutamakan perubahan untuk dihantar minggu ini dan menyemak impak minggu depan.

Bagaimana untuk menanda aras liputan kandungan anda untuk latihan dan petikan

Dalam era Google Search, pengindeksan ialah metrik kesihatan asas. Sebelum halaman boleh berada, mendapat klik, atau menukar, ia mesti berada dalam indeks. Liputan ialah metrik yang sama untuk era LLM, dan ia layak untuk dijejak sebagai perkaranya sendiri, bukan dilipat ke dalam mana-mana isyarat tunggal.

Perbandingan bintang utara

Era Google Search

Era LLM

Pengindeksan (pintu hulu)

Liputan (pintu hulu)

Kedudukan

Petikan

Klik

Rujukan

Liputan ialah peratusan kandungan yang anda peduli yang AI sebenarnya membaca dan menggunakan. Ia adalah perkara yang paling hampir kepada nombor bintang utara untuk saluran AI kerana ia berada di hulu setiap isyarat lain. Jika model tidak menyerap halaman anda, AI tidak boleh menyebutnya. Jika halaman tidak pernah disebut, AI tidak boleh menghantar pengguna kepadanya. Liputan ialah pintu yang menentukan sama ada selebihnya corong itu mungkin.

Memperlakukan liputan sebagai metriknya sendiri, berbeza daripada mana-mana satu daripada tiga isyarat, ialah apa yang menjadikan saluran AI boleh diukur dengan cara yang pasukan biasa dengan carian organik sudah faham. Soalan beralih dari “adakah kita dirangkak” kepada “adakah cukup kandungan yang betul mencapai jawapan”. Liputan dipecahkan dengan kemas mengikut dua isyarat pertama.

Penanda aras liputan latihan

Tentukan alam semesta kandungan rekod anda terlebih dahulu. Untuk pasukan e-dagang ini biasanya semua halaman produk aktif, semua halaman kategori, dan semua panduan evergreen. Untuk penerbit ialah arkib artikel ditambah halaman pendaratan rujukan dan topik. Alam semesta ialah penyebut.

Kemudian tanya: dalam 30 hari yang lalu, apakah peratusan URL itu yang diambil sekurang-kurangnya sekali oleh perangkak latihan disahkan dari mana-mana enjin AI utama? Itulah liputan latihan 30-hari anda. Tapak yang sihat dengan pautan dalaman yang munasabah dan peta tapak yang bersih harus berjalan pada 90 peratus atau lebih tinggi. Di bawah itu, anda mempunyai masalah kebolehjumpaan: bot tidak boleh menemui atau tidak kembali kepada bahagian inventori anda yang bermakna.

Kemudian pisahkan nombor yang sama mengikut enjin AI. Liputan setiap enjin ialah tempat leverage tinggal. OpenAI mungkin meliputi 95 peratus sementara Google meliputi 40 peratus dan Anthropic meliputi 70 peratus. Jurang itu memberitahu anda dengan tepat di mana untuk melabur dalam akses khusus permukaan (semakan robots.txt, penyerahan peta tapak, peningkatan data berstruktur) dan model mana yang akan mewakili jenama anda dengan tepat berbanding lemah apabila pengguna masa hadapan bertanya.

Penanda aras liputan petikan

Liputan petikan dibina dengan cara yang sama tetapi terhadap penyebut yang lebih sempit: kandungan gred rujukan anda, halaman yang anda harapkan AI akan menyebut jika ia memahami tapak anda dengan betul. Untuk pasukan e-dagang ini biasanya panduan, perbandingan, dan kandungan gaya FAQ, bukan halaman produk itu sendiri. Untuk penerbit ialah artikel evergreen dan rujukan anda.

Tanya: dalam 30 hari yang lalu, apakah peratusan URL rujukan itu yang menerima sekurang-kurangnya satu pengambilan langsung dari ChatGPT, Claude, atau Perplexity? Itulah liputan petikan 30-hari anda. Tapak yang kandungan rujukannya tersusun dengan baik, bertajuk dengan baik, dan diperkaya JSON-LD harus berjalan 60 hingga 80 peratus. Di bawah 40 peratus ialah masalah kebolehsebutan, hampir selalu boleh diselesaikan dengan tajuk yang lebih jelas, deskripsi yang lebih baik, salinan gaya FAQ, dan lebih banyak data berstruktur.

Kemudian pisahkan mengikut pembantu. ChatGPT akan menguasai volum pada kebanyakan tapak; Claude akan kurang diwakili dalam mana-mana alat yang tidak mengendalikan trafik bot tidak disahkan dengan betul; Perplexity akan terlalu indeks pada kandungan produk dan rujukan berstruktur.

Bagaimana sihat keseluruhannya

Ambang tepat berbeza-beza mengikut kedalaman arkib, campuran kandungan, dan khalayak, tetapi corak profil yang sihat cukup konsisten untuk diterbitkan:

Liputan latihan 100 halaman teratas anda: pada atau hampir 100 peratus dalam tetingkap 30 hari, dengan sekurang-kurangnya tiga hingga empat enjin AI mengambil secara aktif.
Liputan petikan kandungan gred rujukan anda: 60 hingga 80 peratus dalam tetingkap 30 hari. Di bawah 40 peratus menunjukkan jurang kebolehsebutan dalam tajuk, deskripsi, dan data berstruktur.
Halaman petikan teratas: kandungan evergreen, mendalam, gred rujukan. Halaman utama tidak sepatutnya berada dalam 20 teratas.
Tumpuan petikan: 60 hingga 80 peratus daripada semua petikan pada 30 halaman teratas anda adalah normal. Tumpuan hanya pada 5 teratas anda bermakna permukaan rujukan anda terlalu sempit. Jika nombor anda menyimpang tajam dari corak ini, diagnosisnya biasanya jurang data berstruktur, kandungan yang model tidak anggap boleh disebut, atau masalah liputan yang pautan dalaman dan peta tapak boleh selesaikan.

Untuk primer asas tentang keterlihatan AI sebelum mana-mana ini, lihat Memahami Keterlihatan AI. Untuk rangka kerja tujuh KPI yang memetakan dengan kemas pada model tiga isyarat, lihat Metrik Prestasi AI: Tujuh KPI Setiap Jenama Patut Jejak.

Berhenti Menganggar, Mula Mengaktifkan

Apabila trafik LLM dilaporkan sebagai satu nombor, banyak konteks yang berguna hilang. Kandungan kuat boleh kelihatan lebih tenang daripada sebenarnya kerana kebanyakan impaknya jatuh di luar alat analitik. Prestasi yang menjanjikan sukar untuk dijejaki kembali kepada aktiviti hulu yang mendapatkannya. Pasukan akhirnya bersandar pada isyarat tidak langsung kerana yang langsung belum kelihatan.

Tiga isyarat di tapak anda mengisi gambaran itu. Latihan menunjukkan anda apa yang AI menyerap tentang jenama dan kandungan anda. Petikan menunjukkan anda halaman mana yang AI mencapai untuk menjawab soalan sebenar dalam masa nyata. Rujukan menunjukkan anda pengguna niat tinggi yang AI hantar melalui. Di hulu kesemua tiga ialah liputan, setara era LLM kepada pengindeksan, dan pintu yang menentukan sama ada selebihnya corong itu mungkin.

Dibaca bersama, tiga isyarat memberi pasukan corak merentas isyarat yang jelas untuk bertindak setiap minggu. Bintang AI ialah halaman untuk melindungi, jurang petikan ialah halaman untuk ditulis semula, masalah klik menunjuk kepada kelajuan muat dan pembingkaian petikan, dan jurang liputan menunjuk kepada kebolehjumpaan. Di luar tapak, Share of Voice ialah penanda aras arahan yang berguna untuk perbualan yang berlaku dalam jawapan AI, tetapi untuk mengukur impak prestasi sebenar, model tiga isyarat dalam tapak ialah apa yang kami percaya jenama harus berorientasi padanya semasa mereka melabur dalam pertumbuhan saluran AI.

Bersama-sama, mereka mengubah saluran AI daripada sesuatu untuk dianggar kepada sesuatu yang pasukan anda boleh rancang, ukur, dan bertindak dengan keyakinan.

Ketiga-tiga Isyarat Dalam Satu Papan Pemuka

Papan pemuka di bawah menggabungkan ketiga-tiga isyarat di laman ke dalam satu paparan, dengan liputan kandungan dijejak bersama sebagai pintu hulu. Crawl latihan mendarat setiap halaman, petikan dipecah mengikut enjin, dan rujukan diatribusikan hujung-ke-hujung sehingga ke hasil.

Lihat Demo Papan Pemuka

Soalan Lazim

Apakah perbezaan antara rangkak latihan AI dan pengambilan petikan AI?

Rangkak latihan berlaku di latar belakang dan memberi makan data latihan model. Enjin AI seperti OpenAI, Anthropic, Google, dan Common Crawl menjalankannya mengikut jadual. Pengambilan petikan berlaku dalam masa nyata, apabila pengguna bertanya soalan dan pembantu AI menarik halaman bagi pihak pengguna untuk menjawab. Ejen yang perlu dicari dalam log anda ialah ChatGPT-User, Claude-User, dan Perplexity-User. Latihan membentuk apa yang AI tahu tentang jenama anda; petikan menunjukkan apa yang AI gunakan secara aktif untuk menjawab soalan sekarang.

Bagaimana saya tahu jika kandungan saya disebut oleh ChatGPT, Claude, atau Perplexity?

Cara yang lengkap adalah untuk menangkap log permintaan sebelah pelayan di pinggir dan mengklasifikasikannya mengikut ejen pengguna dan julat IP yang disahkan. ChatGPT-User, Claude-User, dan Perplexity-User mengenal pasti diri mereka dalam permintaan, jadi tangkapan sebelah pelayan memberi anda rekod setiap halaman, setiap pembantu apabila setiap AI menarik halaman untuk menjawab soalan langsung. Alat analitik sebelah pelanggan seperti GA4, Adobe, Mixpanel, Amplitude, Heap, Plausible, Fathom, dan Matomo tidak boleh melihat isyarat ini kerana pengambilan tidak pernah membuka pelayar dan tidak pernah mencetuskan tag JavaScript.

Apakah liputan kandungan untuk LLM dan mengapa ia penting?

Liputan kandungan ialah peratusan kandungan yang anda peduli yang enjin AI sebenarnya membaca dan menggunakan. Ia berfungsi seperti pengindeksan untuk Google Search: ia berada di hulu setiap isyarat lain. Jika AI tidak menyerap halaman anda, ia tidak boleh menyebutnya. Jika ia tidak menyebut halaman, ia tidak boleh menghantar pengguna kepadanya. Liputan ialah metrik kesihatan asas untuk pengukuran saluran AI dan paling hampir kepada nombor bintang utara untuk saluran AI.

Apakah Share of Voice dalam carian AI dan bagaimana ia dibandingkan dengan penjejakan petikan?

Share of Voice ialah pengukuran luar tapak tentang kekerapan jenama anda muncul dalam jawapan yang dijana AI dalam bakul sampel gesaan. Alat seperti Profound, Otterly, Peec, Evertune, AthenaHQ, BrandRank.AI, Ahrefs Brand Radar, dan modul AI dalam Semrush dan BrightEdge menanyakan enjin AI pada skala dan melaporkan bahagian relatif. Ia berguna untuk penanda aras persaingan tetapi adalah probabilistik dan tidak lengkap kerana jawapan AI bukan deterministik dan sampel gesaan dipilih oleh penganalisis. Penjejakan petikan, sebaliknya, ialah rekod sebelah pelayan yang disahkan tentang halaman mana yang AI sebenarnya menarik untuk menjawab soalan sebenar. Gunakan Share of Voice untuk penanda aras arahan dan petikan untuk pengukuran prestasi.

Mengapa Google Analytics 4 melaporkan trafik rujukan AI secara kurang?

GA4 biasanya melaporkan kurang sesi yang dirujuk AI sebanyak 2,5 hingga 5 kali. Punca adalah struktural berbanding boleh dikonfigurasi. Apl mudah alih LLM memaparkan pautan keluar dalam WebView terpencil yang menanggalkan perujuk. Gemini dan Claude tidak menghantar isyarat atribusi pada kebanyakan platform yang diuji. Gambaran Keseluruhan AI Google dikumpulkan di bawah carian organik tanpa cara untuk memisahkannya. Jurang yang sama digunakan untuk mana-mana alat analitik sebelah pelanggan lain, kerana isunya ialah model pengukuran tag JavaScript itu sendiri, bukan alat tersebut.

Bagaimanakah pengguna yang dirujuk AI berkelakuan berbeza daripada trafik organik atau sosial?

Pengguna yang dirujuk AI cenderung untuk menukar pada kadar setiap sesi yang lebih tinggi daripada sosial dan selalunya lebih tinggi daripada organik sebaik sahaja Gambaran Keseluruhan AI dipisahkan dari organik. Mereka tiba selepas menyelidik soalan dengan AI, menilai jawapan, dan memilih halaman anda sebagai langkah seterusnya, jadi mereka lebih jauh ke bawah lengkung pertimbangan berbanding pengguna dari saluran yang mengganggu mereka. Masa-ke-pembelian berbeza mengikut enjin AI. Pengguna ChatGPT cenderung untuk menukar pada hari yang sama, pengguna Gemini mengambil masa berbilang hari, pengguna Perplexity selalunya mengambil masa tiga hingga lima hari. Memendekkan tetingkap atribusi untuk semua mereka melaporkan saluran secara kurang.

Di mana saya patut mula apabila pengukuran saluran AI baru untuk pasukan saya?

Mulakan dengan liputan kandungan. Sahkan bahawa enjin AI utama, OpenAI, Anthropic, Google, Perplexity, dan Common Crawl, boleh mencapai dan secara aktif membaca kandungan yang penting. Apabila gambaran hulu jelas, tambahkan penjejakan petikan untuk melihat halaman mana yang AI sebenarnya menggunakan untuk menjawab soalan. Tambah atribusi rujukan terakhir, kerana nombor rujukan tanpa konteks liputan dan petikan adalah mustahil untuk bertindak. Liputan ialah pintu yang setiap isyarat lain duduk di atasnya, dan bermula di sana membina asas yang seluruh rangka kerja boleh berkembang.

It's Now Safer to Put Cloudflare in Front of Shopify: What O2O Fixed, and What the Warnings Still Mean

Pemantauan trafik LLM: tiga isyarat (latihan, petikan, rujukan)

Apa sebenarnya trafik LLM

Mengapa GA4 dan alat analitik sebelah pelanggan lain mengalami kesukaran dengan ini

Isyarat 1: Latihan LLM

Rangkak latihan AI kini berada pada skala enjin carian

Apa yang perlu dilihat

Media sebagai data latihan: melangkaui badan artikel

KPI yang penting

Isyarat 2: Petikan perbualan, lapisan masa nyata

Apa yang perlu dilihat

Mengapa isyarat ini bernilai unik

Petikan vs. Share of Voice (SOV)

KPI yang penting

Isyarat 3: Pengguna sebenar, rujukan niat tinggi

Apa yang perlu dilihat

Bagaimana mengukur trafik rujukan dari LLM dalam Google Analytics (jawapan jujur)

Mudah alih ialah tempat di mana jurang atribusi LLM paling besar

KPI yang penting

Dari isyarat ke tindakan: bagaimana data trafik LLM memacu impak

Kesegaran kandungan

Halaman dirangkak tetapi tidak disebut

Peta tindakan merentas isyarat

Bagaimana untuk menanda aras liputan kandungan anda untuk latihan dan petikan

Penanda aras liputan latihan

Penanda aras liputan petikan

Bagaimana sihat keseluruhannya

Berhenti Menganggar, Mula Mengaktifkan

Ketiga-tiga Isyarat Dalam Satu Papan Pemuka

Soalan Lazim

Apakah perbezaan antara rangkak latihan AI dan pengambilan petikan AI?

Bagaimana saya tahu jika kandungan saya disebut oleh ChatGPT, Claude, atau Perplexity?

Apakah liputan kandungan untuk LLM dan mengapa ia penting?

Apakah Share of Voice dalam carian AI dan bagaimana ia dibandingkan dengan penjejakan petikan?

Mengapa Google Analytics 4 melaporkan trafik rujukan AI secara kurang?

Bagaimanakah pengguna yang dirujuk AI berkelakuan berbeza daripada trafik organik atau sosial?

Di mana saya patut mula apabila pengukuran saluran AI baru untuk pasukan saya?