SEO 1 กรกฎาคม 2569

ChatGPT เลือกแหล่งข้อมูลยังไง? เปิด Network Traffic ดูของจริง

การตลาดยุคใหม่ต้องเข้าใจว่า AI “เห็น” เรายังไง — ไม่ใช่แค่ Google Rank เท่านั้น

ถ้าคุณเป็นคนทำ SEO หรือ Content Marketing คุณคงเคยได้ยินคำถามนี้:

“ทำยังไงให้แบรนด์เราโผล่ใน ChatGPT?”

คำตอบที่เราได้ยินซ้ำๆ คือ “เขียนคอนเทนต์ดีๆ”, “ทำลิสต์icle”, “ไปเม้น Reddit” — แต่ไม่มีใครเคยบอกว่า เราไปอ่าน network traffic ของ ChatGPT จริงๆ ดูไหมว่า mechanism มันทำงานยังไง?

Suganthan Mohanadasan (Co-founder Snippet Digital) ทำแบบนั้นแหละ เขานั่งอ่าน JSON ที่ ChatGPT ส่งไปมายังบราวเซอร์ของเขา — ไม่ใช่แค่อ่าน output ที่เราเห็น แต่ดู layer ลึกลงไปว่า ChatGPT ตัดสินใจดึงข้อมูลจากที่ไหน และใช้เกณฑ์อะไร

นี่คือสิ่งที่เขาค้นพบ

📚 สารบัญ

4 ชั้นของผลลัพธ์ที่ ChatGPT ใช้
6 ประเภทคำถาม — บางประเภทไม่ Search เลย
Fan-out Queries: 1 คำถาม → 40 การค้นหา
Fetched ≠ Cited ≠ Mentioned
สิ่งที่ ChatGPT มองไม่เห็น
ทำยังไงให้แบรนด์คุณโดนเลือก?
สรุป Actionable Takeaways

4 ชั้นของแหล่งข้อมูลใน ChatGPT

ChatGPT source pipelines: SERP, Labrador, Bright Data, Oxylabs

ใน network traffic ของ ChatGPT มี field หนึ่งชื่อ result_source — มันถูกติดไว้กับทุก web result ที่ ChatGPT ดึงมา โดยคุณไม่มีทางเห็น field นี้ใน answer ปกติ

result_source มี 4 ค่า:

result_source	มันคืออะไร	ตัวอย่าง
serp	Open web baseline — ส่วนใหญ่เป็นข่าว	Yahoo, StreetInsider
labrador	Allowlist ของ publishers ที่มีดีลกับ OpenAI	Reuters, WSJ, FT, Wikipedia, arXiv
bright	Bright Data — commercial web scraper	Reddit, Forbes, rtings
oxylabs	Oxylabs — คู่แข่ง Bright Data	Gulf News, Khaleej Times, regional press

labrador คือ licensed tier — ถ้าคุณไม่ได้เป็นเจ้าของหนังสือพิมพ์ระดับประเทศ ก็เข้า tier นี้ไม่ได้

bright กับ oxylabs คือคู่หูที่ ChatGPT จ้างมา crawl เว็บให้ โดย bright ทำหน้าที่หลักใน commercial, shopping, finance, weather ส่วน oxylabs เก็บบริเวณ regional และ local press

ใน query เดียว — เช่นถามสภาพอากาศ — ChatGPT ดึงข้อมูลจากหลาย pipeline พร้อมกัน: metoffice.gov.uk ผ่าน bright, khaleejtimes.com ผ่าน oxylabs

📌 GEO Takeaway

คุณแข่งขันใน scraped tier (bright + oxylabs) ดังนั้น:

ทำให้เว็บคุณ cleanly scrapable — ข้อมูล ตัวเลข ราคา ต้องอยู่ใน plain HTML text
อย่าซ่อนไว้ใน script, PDF, หรือ image — scrapers อ่านไม่ได้
สร้าง third-party coverage, PR, และ brand mentions — นี่คือทางเข้า scraper ที่จะเจอคุณ

6 ประเภทคำถาม — บางประเภทไม่ Search เลย

ChatGPT มี field turn_use_case ที่จัดประเภทคำถามของคุณก่อนว่าจะ search หรือไม่:

instant search — ค้นหาทั่วไป
shopping — ค้นหาสินค้า
text — ไม่ search เลย, ตอบจาก training data
local — ค้นหารอบตัว
thinking — reasoning mode, ค้นหาเชิงลึก
image generation — สร้างภาพ

ประเภทที่ต้องสนใจมากที่สุดคือ text

เมื่อ ChatGPT จัดคำถามคุณเป็น text — มันจะไม่ search เลย มันตอบจากความจำใน training data คำถามประเภท how-to, definition, translation — แม้แต่ “latest treatment guidelines for type 2 diabetes” ก็ถูกจัดเป็น text!

ใน 10 คำถามปัจจุบันที่เขาทดสอบ — 3 คำถามถูกจัดเป็น text และตอบจาก training data โดยไม่ search เลย

การตัดสินใจขึ้นอยู่กับ wording ไม่ใช่ topic — “best coffee near me” → local pipeline, “best 4K TVs to buy” → shopping แต่ “best 4K TVs with reviews” → normal search

📌 GEO Takeaway

ก่อนลงทุนทำหน้า page หนึ่ง — เช็คก่อนว่าคำถามนี้ ChatGPT search จริงๆ หรือตอบจาก training data

ถ้ามันถูกจัดเป็น text — ไม่มี page ไหนในโลกเข้าไปได้ เพราะ ChatGPT ไม่ได้ search เลย ต้องใช้เวลาสร้าง authority และรอให้แบรนด์คุณถูกรวมใน training data รอบหน้า

Fan-out Queries: 1 คำถาม → 40 การค้นหา

Fan-out queries: 1 question splitting into 15-40 sub-queries

ChatGPT เปิดเผย search queries ที่มันรันผ่าน API — และใน Thinking mode 1 คำถามกลายเป็นการค้นหาย่อย 15-40 ครั้ง

ตัวอย่างของ query เปรียบเทียบ pricing เครื่องมือ AI visibility:

"Profound AI search visibility pricing AI engines tracked 2026"
"AthenaHQ pricing AI search visibility tool"
"site:peec.ai/pricing Peec AI Starter Pro Advanced 50 prompts 150 prompts"
"Peec AI pricing $95 $245 $495 official"  ← เดาราคาแล้ว search ยืนยัน
"Scrunch AI pricing"  ← ไม่ได้อยู่ใน prompt แต่เจอระหว่างค้น
...รวม ~40 queries

สามสิ่งที่โดดเด่น:

ChatGPT ยิง site: probes ตรงไปที่ vendor pricing pages
มัน เดาราคา แล้ว search เพื่อยืนยัน
มัน widen ไปเรื่อยๆ — เจอ tool ที่คุณไม่ได้ถามถึง ก็ chase pricing ต่อ

📌 GEO Takeaway

ตัวเลขสำคัญต้องอยู่ใน plain HTML text — โดยเฉพาะ pricing เพราะ ChatGPT grep หา $ และ €
JavaScript-based toggle และ dynamic data loading = ตาย เพราะ ChatGPT อ่านไม่เจอ
เขียนให้ตรงกับ query ที่ ChatGPT รัน จริง — ไม่ใช่คำค้นของมนุษย์
ถ้า pricing ของคุณซ่อนใน JS — ChatGPT จะยอมแพ้แล้วไป quote G2 แทน

Fetched ≠ Cited ≠ Mentioned

นี่คือความแตกต่างที่คนสับสนมากที่สุด — สามสิ่งนี้ไม่เหมือนกัน:

Fetched — ChatGPT ดึงหน้าคุณเข้ามาใน context (user ไม่เห็น)
Cited — ใส่ URL ของคุณเป็น source ข้างหลัง specific sentence
Mentioned — ชื่อแบรนด์คุณโผล่ใน answer (อาจเป็น chip ลิงก์เว็บคุณ)

คุณสามารถชนะหรือแพ้แต่ละอย่างได้โดยอิสระ

ในการทดสอบของ Suganthan — Reddit ถูก fetch 278 ครั้ง แต่ cited แค่ 11 ครั้ง ส่วน YouTube ถูก fetch 201 ครั้ง แต่ ไม่เคยถูก cited เลยสักครั้ง

สาเหตุ: citation ต้อง bind กับ text ที่ model อ่านได้จริง — YouTube page ให้แค่ metadata (title, description) ไม่ใช่ transcript ส่วน Reddit มี text ให้ quote เต็มๆ

📌 GEO Takeaway

คุณ cite ตัวเองไม่ได้ — claim เกี่ยวกับคุณ ต้องมี third-party coverage
เน้น content ที่เป็น text (Reddit, blog, review sites) มากกว่า video
1 หน้าที่แข็งแรง ดีกว่า 20 หน้าที่บาง — ChatGPT dedup by domain
ราคาและ spec ของคุณควรอ่านได้จากหน้าของคุณเอง ไม่งั้นมือไป G2

สิ่งที่ ChatGPT มองไม่เห็น — และทำไม G2 ถึงได้ cited

ChatGPT เก็บ chain of thought ไว้ใน conversation — และมันอธิบายการเลือก sources ด้วยคำพูดของมันเอง:

“pricing page seems more current, so I should cite that”

“the pricing isn’t showing up directly in the search result, possibly because it’s loaded with JavaScript”

“I can quote third-party sources since the official page is hard to parse and doesn’t show prices”

“use citations from G2 where appropriate”

นี่คือเกมทั้งเกมใน trace เดียว — ChatGPT อยาก cite official page แต่ถ้า official page อ่านไม่ได้ (JS, image-based pricing) — มันจะ fallback ไปที่ G2 และ third-party sites

ข้อควรรู้เพิ่มเติม:

ไม่มี ranking score หรือ domain authority ใน traffic ที่ browser เห็น — ใครขาย “ChatGPT ranking factors” คือขายน้ำมันงู
Personalization มีจริง — ChatGPT ดึง conversation history คุณมาใช้ใน answer (field: personal_sources: ["convo_search", "gmail", "files"])
Local results ถูก capped ที่ 2 — ถ้าถามร้านกาแฟใกล้ฉัน ได้แค่ 2 ที่ ไม่ใช่ top 10

สรุป Actionable Takeaways

สิ่งที่ต้องทำ	เหตุผล
✅ ทำให้เว็บ cleanly scrapable	ข้อมูล ราคา spec ต้องอยู่ใน plain HTML — scrapers อ่าน JS ไม่ได้
✅ สร้าง third-party coverage	85% ของ citations มาจาก third-party sources — PR, Reddit, review sites
✅ เขียนเพื่อ query ที่ ChatGPT รันจริง	ChatGPT ไม่ได้ใช้คำค้นมนุษย์ — มัน rephrase และยิง site: probes
✅ เน้น text-based content	YouTube ถูก cited = 0 — Reddit ถูก cited ตลอด
✅ 1 หน้าที่แข็งแรง ดีกว่า 20 หน้าบาง	ChatGPT dedup by domain
❌ อย่าซ่อน pricing ไว้ใน JS	ChatGPT จะยอมแพ้และไป cite G2 แทน
❌ อย่าลงทุนกับคำถามที่ ChatGPT ไม่ search	เช็คก่อนว่าคำถามของคุณถูกจัดเป็น `text` หรือไม่

ทิ้งท้าย: ChatGPT ไม่ใช่ search engine ดังนั้นหยุด optimize เหมือนทำ SEO บน Google มันอ่านหน้า คุณเพื่อหาข้อเท็จจริง และอ่าน third-party เพื่อหาความคิดเห็น — และมันจะทำอย่างนั้นก็ต่อเมื่อคำถามนั้นคุ้มค่าที่จะ search

ที่มา:

Suganthan Mohanadasan, “How ChatGPT Actually Picks Sources (I Read The Network Traffic, Not The Outputs)” — Search Engine Journal, June 30, 2026
arXiv 2606.25787 — “How Large Language Models Source Brand Reputation Across Languages and Markets”