Anda mencari nama perusahaan Anda di ChatGPT. Nihil. Anda menanyakan agensi SEO B2B terbaik di Indonesia. Kompetitor Anda muncul. Anda tidak. Sekarang Anda bertanya-tanya strategi GEO apa yang Anda butuhkan untuk memperbaikinya.
Hal ini lebih penting dari sebelumnya. Riset Forrester menemukan bahwa 90% organisasi kini menggunakan generative AI di sebagian proses pembelian mereka, dan riset G2 yang terpisah menemukan bahwa 51% pembeli software B2B kini memulai risetnya di chatbot AI alih-alih search engine. Kalau Anda absen dari percakapan itu, Anda absen di titik awal siklus beli.
Sebelum menempuh jalur itu, Anda perlu memahami sesuatu yang lebih mendasar: bagaimana LLM sebenarnya mengetahui sesuatu. Ada dua mekanisme, dan keduanya bermuara pada akar penyebab yang sama.
Bagaimana LLM mendapatkan informasinya
Large language model punya dua cara berbeda untuk mengetahui hal-hal tentang dunia.
Yang pertama adalah data pelatihan. Sebelum sebuah model seperti ChatGPT dirilis, ia dilatih di atas potret raksasa teks dari internet — miliaran halaman web, artikel, forum, dokumentasi, dan lainnya. Ini adalah proses sekali jalan dengan tanggal cutoff. Segala yang dipelajari model tentang dunia berasal dari apa yang ada di web hingga titik itu. Kalau perusahaan Anda tidak terwakili dalam potret tersebut — entah karena Anda belum berdiri, atau karena kehadiran web Anda terlalu tipis untuk tertangkap — model itu sama sekali tidak tahu Anda ada. Anda bukan bagian dari pendidikannya.
Yang kedua adalah pengambilan real-time. Untuk query terkini, sebagian besar tool AI — ChatGPT dengan web browsing, Perplexity, Google AI Overviews — tidak murni mengandalkan data pelatihan. Mereka memanggil search API, mengambil halaman web yang hidup, dan menggunakannya sebagai sumber jawaban. Kita sudah membahas persis cara kerjanya di What is AI SEO, exactly? — versi singkatnya, mereka menarik dari Google dan Bing, yang berarti ranking pencarian Anda menentukan apakah Anda diambil.
Perusahaan Anda tidak terlihat di ChatGPT karena salah satu atau kedua alasan ini. Mari kita bedah satu per satu.
Masalah data pelatihan
Dataset pelatihan untuk large language model dibangun terutama dari crawl web berskala besar — Common Crawl menjadi yang paling signifikan. Common Crawl pada dasarnya adalah potret dari sebagian besar web yang terindeks, diambil secara berkala — ia telah mengumpulkan petabyte data halaman sejak 2008, dan satu potret bulanan terbaru saja memuat 2,44 miliar halaman. Ia fundamental bagi cara model-model ini dibangun: pada GPT-3, data Common Crawl yang sudah difilter menyumbang 60% dari campuran pelatihan.
Dua hal menentukan apakah perusahaan Anda masuk ke dalam potret itu.
Apakah situs Anda terindeks dengan benar. Common Crawl menarik dari web dengan cara yang sama seperti search engine — ia mengikuti tautan, meng-crawl halaman, dan menangkap konten. Kalau situs Anda punya SEO teknis yang buruk, konten tipis, otoritas lemah, atau sekadar sulit di-crawl, ia bisa terlewat atau tertangkap secara seadanya. Ini bukan kasus langka: satu analisis terhadap 1,7 juta halaman menemukan bahwa 88% halaman yang ditolak Google untuk diindeks dikecualikan karena alasan kualitas. Kalau Google enggan mengindeks sebuah halaman, crawl berskala web yang dibangun dengan cara sama pun tidak mungkin menangkapnya secara berarti. Kualitas crawl atas representasi data pelatihan Anda adalah fungsi langsung dari SEO Anda. Perusahaan dengan kehadiran web yang kuat dan situs yang terstruktur baik terwakili secara berlebih di data pelatihan. Perusahaan dengan SEO buruk terwakili kurang atau malah absen.
Apakah Anda sudah ada sebelum cutoff pelatihan. Setiap LLM punya knowledge cutoff — tanggal yang setelahnya ia tak punya data pelatihan. Cutoff GPT-5.5 adalah awal 2026. Apa pun yang terjadi setelah tanggal itu, perusahaan apa pun yang berdiri setelah tanggal itu, konten apa pun yang diterbitkan setelah tanggal itu — model itu tidak punya pengetahuan tentangnya dari pelatihan saja. Kalau perusahaan Anda tergolong baru atau baru-baru ini melakukan rebranding besar, Anda bisa jadi sekadar tidak ada di data pelatihan, terlepas dari SEO Anda.
Solusi untuk masalah pertama jelas: SEO yang lebih baik berarti kehadiran web yang lebih baik berarti representasi yang lebih baik di dataset pelatihan mendatang. Solusi untuk masalah kedua ada di lapisan pengambilan — yang membawa kita kembali ke ranking.
Masalah pengambilan
Bahkan kalau perusahaan Anda tidak ada di data pelatihan, Anda tetap bisa muncul di jawaban yang dihasilkan AI — asalkan Anda ranking cukup baik untuk diambil secara real-time. Seperti dijelaskan di What is AI SEO, exactly?, tool AI dengan web browsing memanggil search API dan meneruskan halaman yang diambil ke model sebagai konteks.
Kalau Anda ranking untuk query yang dipantik pertanyaan pengguna, halaman Anda diteruskan ke model. Kalau tidak, ya tidak. Lapisan pengambilan tidak peduli pada representasi data pelatihan Anda — ia peduli pada ranking pencarian Anda saat ini.
Dua jalur untuk muncul di ChatGPT sama-sama menuntut hal yang sama: kehadiran web yang cukup kuat untuk diindeks, di-ranking, dan ditemukan.
Inilah sebabnya perusahaan yang menjalankan SEO dengan baik cenderung muncul di jawaban AI, dan perusahaan yang mengabaikannya cenderung tidak — terlepas dari mekanisme mana yang Anda tinjau.
Apa sebenarnya arti “terlalu dalam menyamar”
Ada skenario ketiga yang kurang kentara. Sebagian perusahaan B2B punya website yang lumayan tapi nyaris tanpa kehadiran web eksternal. Tak ada liputan pers. Tak ada penyebutan pihak ketiga. Tak ada backlink dari sumber industri yang relevan. Tak ada kehadiran di forum, direktori, atau basis data industri.
Perusahaan-perusahaan ini mungkin terindeks dan bahkan ranking untuk query bermerek. Tapi untuk query industri atau kategori umum — jenis yang akan ditanyakan pembeli B2B ke ChatGPT — mereka tidak muncul. Data pelatihan menangkap sangat sedikit tentang mereka karena memang ada sangat sedikit untuk ditangkap. Lapisan pengambilan tidak bisa menemukan mereka untuk query non-merek karena mereka tidak ranking untuk apa pun selain nama mereka sendiri.
Inilah masalah “terlalu dalam menyamar”. Solusinya bukan taktik GEO. Melainkan membangun kehadiran web yang semestinya memang sudah dibangun sejak awal — konten yang menghasilkan tautan, liputan yang memantik penyebutan, dan strategi SEO B2B yang dirancang seputar query yang benar-benar dipakai pembeli Anda. Inilah persis sinyal yang paling diberi bobot oleh sistem AI: studi Ahrefs terhadap 75.000 brand menemukan bahwa penyebutan web bermerek berkorelasi dengan visibilitas AI sebesar 0,664 — sekitar tiga kali lebih kuat dibanding backlink. Kalau tak seorang pun di web membicarakan Anda, AI pun tidak akan.
Cara membuat website Anda muncul di ChatGPT
Tidak ada formulir pendaftaran. Tidak ada “indeks ChatGPT” yang bisa Anda daftari. Jalurnya sama seperti yang sudah-sudah — bangun situs yang Google ingin ranking-kan, produksi konten yang menghasilkan otoritas, dan pastikan halaman Anda bisa di-crawl serta terindeks dengan benar. Lakukan itu secara konsisten dan Anda akan muncul di jawaban yang dihasilkan AI, karena tool AI menarik dari infrastruktur pencarian yang sama yang sudah Anda upayakan untuk ranking di dalamnya.
Satu-satunya hal yang benar-benar baru adalah perilaku query fan-out yang kita bahas di What is AI SEO, exactly? — menulis konten niche yang mencakup sub-pertanyaan spesifik yang dihasilkan LLM ketika mengurai sebuah topik yang lebih luas. Itu layak dilakukan sebagai pelengkap pekerjaan SEO inti Anda. Tapi ia bukan pengganti.
Diagnosis praktis
Kalau perusahaan Anda tidak muncul di ChatGPT, telusuri daftar ini sebelum melakukan apa pun:
- Apakah situs Anda ranking di Google untuk query non-merek apa pun di kategori Anda?
- Apakah situs Anda terindeks dengan benar — apakah halaman-halaman kunci Anda muncul di Google Search Console?
- Apakah perusahaan Anda punya penyebutan pihak ketiga, liputan, atau backlink dari sumber yang relevan?
- Kapan perusahaan Anda berdiri atau melakukan rebranding — apakah setelah cutoff pelatihan model?
Kalau jawaban untuk tiga pertanyaan pertama adalah tidak, masalahnya bukan GEO. Masalahnya SEO. Perbaiki itu lebih dulu. Visibilitas AI akan mengikuti.
Kalau masalahnya soal kebaruan — perusahaan Anda sekadar terlalu baru untuk masuk data pelatihan — lapisan pengambilan adalah jalur Anda menuju visibilitas, yang berarti ranking harus menjadi prioritas Anda sekarang.
Bagaimanapun juga, jawabannya tetap sama.
Praktisi B2B SEO yang berspesialisasi dalam strategi pencarian di era AI. Bekerja langsung dengan marketing manager di perusahaan menengah — tanpa account manager, tanpa handoff.