← บทความทั้งหมด

ChatGPT เลือกแหล่งข้อมูลยังไง? เปิด Network Traffic ดูของจริง

ChatGPT เลือกแหล่งข้อมูลยังไง? เปิด Network Traffic ดูของจริง

ChatGPT เลือกแหล่งข้อมูลยังไง? เปิด Network Traffic ดูของจริง

การตลาดยุคใหม่ต้องเข้าใจว่า AI “เห็น” เรายังไง — ไม่ใช่แค่ Google Rank เท่านั้น

ถ้าคุณเป็นคนทำ SEO หรือ Content Marketing คุณคงเคยได้ยินคำถามนี้:

“ทำยังไงให้แบรนด์เราโผล่ใน ChatGPT?”

คำตอบที่เราได้ยินซ้ำๆ คือ “เขียนคอนเทนต์ดีๆ”, “ทำลิสต์icle”, “ไปเม้น Reddit” — แต่ไม่มีใครเคยบอกว่า เราไปอ่าน network traffic ของ ChatGPT จริงๆ ดูไหมว่า mechanism มันทำงานยังไง?

Suganthan Mohanadasan (Co-founder Snippet Digital) ทำแบบนั้นแหละ เขานั่งอ่าน JSON ที่ ChatGPT ส่งไปมายังบราวเซอร์ของเขา — ไม่ใช่แค่อ่าน output ที่เราเห็น แต่ดู layer ลึกลงไปว่า ChatGPT ตัดสินใจดึงข้อมูลจากที่ไหน และใช้เกณฑ์อะไร

นี่คือสิ่งที่เขาค้นพบ

📚 สารบัญ

  • 4 ชั้นของผลลัพธ์ที่ ChatGPT ใช้
  • 6 ประเภทคำถาม — บางประเภทไม่ Search เลย
  • Fan-out Queries: 1 คำถาม → 40 การค้นหา
  • Fetched ≠ Cited ≠ Mentioned
  • สิ่งที่ ChatGPT มองไม่เห็น
  • ทำยังไงให้แบรนด์คุณโดนเลือก?
  • สรุป Actionable Takeaways

4 ชั้นของแหล่งข้อมูลใน ChatGPT

ChatGPT source pipelines: SERP, Labrador, Bright Data, Oxylabs

ใน network traffic ของ ChatGPT มี field หนึ่งชื่อ result_source — มันถูกติดไว้กับทุก web result ที่ ChatGPT ดึงมา โดยคุณไม่มีทางเห็น field นี้ใน answer ปกติ

result_source มี 4 ค่า:

result_sourceมันคืออะไรตัวอย่าง
serpOpen web baseline — ส่วนใหญ่เป็นข่าวYahoo, StreetInsider
labradorAllowlist ของ publishers ที่มีดีลกับ OpenAIReuters, WSJ, FT, Wikipedia, arXiv
brightBright Data — commercial web scraperReddit, Forbes, rtings
oxylabsOxylabs — คู่แข่ง Bright DataGulf News, Khaleej Times, regional press

labrador คือ licensed tier — ถ้าคุณไม่ได้เป็นเจ้าของหนังสือพิมพ์ระดับประเทศ ก็เข้า tier นี้ไม่ได้

bright กับ oxylabs คือคู่หูที่ ChatGPT จ้างมา crawl เว็บให้ โดย bright ทำหน้าที่หลักใน commercial, shopping, finance, weather ส่วน oxylabs เก็บบริเวณ regional และ local press

ใน query เดียว — เช่นถามสภาพอากาศ — ChatGPT ดึงข้อมูลจากหลาย pipeline พร้อมกัน: metoffice.gov.uk ผ่าน bright, khaleejtimes.com ผ่าน oxylabs

📌 GEO Takeaway

คุณแข่งขันใน scraped tier (bright + oxylabs) ดังนั้น:

  • ทำให้เว็บคุณ cleanly scrapable — ข้อมูล ตัวเลข ราคา ต้องอยู่ใน plain HTML text
  • อย่าซ่อนไว้ใน script, PDF, หรือ image — scrapers อ่านไม่ได้
  • สร้าง third-party coverage, PR, และ brand mentions — นี่คือทางเข้า scraper ที่จะเจอคุณ

6 ประเภทคำถาม — บางประเภทไม่ Search เลย

ChatGPT มี field turn_use_case ที่จัดประเภทคำถามของคุณก่อนว่าจะ search หรือไม่:

  1. instant search — ค้นหาทั่วไป
  2. shopping — ค้นหาสินค้า
  3. textไม่ search เลย, ตอบจาก training data
  4. local — ค้นหารอบตัว
  5. thinking — reasoning mode, ค้นหาเชิงลึก
  6. image generation — สร้างภาพ

ประเภทที่ต้องสนใจมากที่สุดคือ text

เมื่อ ChatGPT จัดคำถามคุณเป็น text — มันจะไม่ search เลย มันตอบจากความจำใน training data คำถามประเภท how-to, definition, translation — แม้แต่ “latest treatment guidelines for type 2 diabetes” ก็ถูกจัดเป็น text!

ใน 10 คำถามปัจจุบันที่เขาทดสอบ — 3 คำถามถูกจัดเป็น text และตอบจาก training data โดยไม่ search เลย

การตัดสินใจขึ้นอยู่กับ wording ไม่ใช่ topic — “best coffee near me” → local pipeline, “best 4K TVs to buy” → shopping แต่ “best 4K TVs with reviews” → normal search

📌 GEO Takeaway

ก่อนลงทุนทำหน้า page หนึ่ง — เช็คก่อนว่าคำถามนี้ ChatGPT search จริงๆ หรือตอบจาก training data

ถ้ามันถูกจัดเป็น text — ไม่มี page ไหนในโลกเข้าไปได้ เพราะ ChatGPT ไม่ได้ search เลย ต้องใช้เวลาสร้าง authority และรอให้แบรนด์คุณถูกรวมใน training data รอบหน้า


Fan-out Queries: 1 คำถาม → 40 การค้นหา

Fan-out queries: 1 question splitting into 15-40 sub-queries

ChatGPT เปิดเผย search queries ที่มันรันผ่าน API — และใน Thinking mode 1 คำถามกลายเป็นการค้นหาย่อย 15-40 ครั้ง

ตัวอย่างของ query เปรียบเทียบ pricing เครื่องมือ AI visibility:

"Profound AI search visibility pricing AI engines tracked 2026"
"AthenaHQ pricing AI search visibility tool"
"site:peec.ai/pricing Peec AI Starter Pro Advanced 50 prompts 150 prompts"
"Peec AI pricing $95 $245 $495 official"  ← เดาราคาแล้ว search ยืนยัน
"Scrunch AI pricing"  ← ไม่ได้อยู่ใน prompt แต่เจอระหว่างค้น
...รวม ~40 queries

สามสิ่งที่โดดเด่น:

  1. ChatGPT ยิง site: probes ตรงไปที่ vendor pricing pages
  2. มัน เดาราคา แล้ว search เพื่อยืนยัน
  3. มัน widen ไปเรื่อยๆ — เจอ tool ที่คุณไม่ได้ถามถึง ก็ chase pricing ต่อ

📌 GEO Takeaway

  • ตัวเลขสำคัญต้องอยู่ใน plain HTML text — โดยเฉพาะ pricing เพราะ ChatGPT grep หา $ และ
  • JavaScript-based toggle และ dynamic data loading = ตาย เพราะ ChatGPT อ่านไม่เจอ
  • เขียนให้ตรงกับ query ที่ ChatGPT รัน จริง — ไม่ใช่คำค้นของมนุษย์
  • ถ้า pricing ของคุณซ่อนใน JS — ChatGPT จะยอมแพ้แล้วไป quote G2 แทน

Fetched ≠ Cited ≠ Mentioned

นี่คือความแตกต่างที่คนสับสนมากที่สุด — สามสิ่งนี้ไม่เหมือนกัน:

  1. Fetched — ChatGPT ดึงหน้าคุณเข้ามาใน context (user ไม่เห็น)
  2. Cited — ใส่ URL ของคุณเป็น source ข้างหลัง specific sentence
  3. Mentioned — ชื่อแบรนด์คุณโผล่ใน answer (อาจเป็น chip ลิงก์เว็บคุณ)

คุณสามารถชนะหรือแพ้แต่ละอย่างได้โดยอิสระ

ในการทดสอบของ Suganthan — Reddit ถูก fetch 278 ครั้ง แต่ cited แค่ 11 ครั้ง ส่วน YouTube ถูก fetch 201 ครั้ง แต่ ไม่เคยถูก cited เลยสักครั้ง

สาเหตุ: citation ต้อง bind กับ text ที่ model อ่านได้จริง — YouTube page ให้แค่ metadata (title, description) ไม่ใช่ transcript ส่วน Reddit มี text ให้ quote เต็มๆ

📌 GEO Takeaway

  • คุณ cite ตัวเองไม่ได้ — claim เกี่ยวกับคุณ ต้องมี third-party coverage
  • เน้น content ที่เป็น text (Reddit, blog, review sites) มากกว่า video
  • 1 หน้าที่แข็งแรง ดีกว่า 20 หน้าที่บาง — ChatGPT dedup by domain
  • ราคาและ spec ของคุณควรอ่านได้จากหน้าของคุณเอง ไม่งั้นมือไป G2

สิ่งที่ ChatGPT มองไม่เห็น — และทำไม G2 ถึงได้ cited

ChatGPT เก็บ chain of thought ไว้ใน conversation — และมันอธิบายการเลือก sources ด้วยคำพูดของมันเอง:

“pricing page seems more current, so I should cite that”

“the pricing isn’t showing up directly in the search result, possibly because it’s loaded with JavaScript”

“I can quote third-party sources since the official page is hard to parse and doesn’t show prices”

“use citations from G2 where appropriate”

นี่คือเกมทั้งเกมใน trace เดียว — ChatGPT อยาก cite official page แต่ถ้า official page อ่านไม่ได้ (JS, image-based pricing) — มันจะ fallback ไปที่ G2 และ third-party sites

ข้อควรรู้เพิ่มเติม:

  • ไม่มี ranking score หรือ domain authority ใน traffic ที่ browser เห็น — ใครขาย “ChatGPT ranking factors” คือขายน้ำมันงู
  • Personalization มีจริง — ChatGPT ดึง conversation history คุณมาใช้ใน answer (field: personal_sources: ["convo_search", "gmail", "files"])
  • Local results ถูก capped ที่ 2 — ถ้าถามร้านกาแฟใกล้ฉัน ได้แค่ 2 ที่ ไม่ใช่ top 10

สรุป Actionable Takeaways

สิ่งที่ต้องทำเหตุผล
ทำให้เว็บ cleanly scrapableข้อมูล ราคา spec ต้องอยู่ใน plain HTML — scrapers อ่าน JS ไม่ได้
สร้าง third-party coverage85% ของ citations มาจาก third-party sources — PR, Reddit, review sites
เขียนเพื่อ query ที่ ChatGPT รันจริงChatGPT ไม่ได้ใช้คำค้นมนุษย์ — มัน rephrase และยิง site: probes
เน้น text-based contentYouTube ถูก cited = 0 — Reddit ถูก cited ตลอด
1 หน้าที่แข็งแรง ดีกว่า 20 หน้าบางChatGPT dedup by domain
อย่าซ่อน pricing ไว้ใน JSChatGPT จะยอมแพ้และไป cite G2 แทน
อย่าลงทุนกับคำถามที่ ChatGPT ไม่ searchเช็คก่อนว่าคำถามของคุณถูกจัดเป็น text หรือไม่

ทิ้งท้าย: ChatGPT ไม่ใช่ search engine ดังนั้นหยุด optimize เหมือนทำ SEO บน Google มันอ่านหน้า คุณเพื่อหาข้อเท็จจริง และอ่าน third-party เพื่อหาความคิดเห็น — และมันจะทำอย่างนั้นก็ต่อเมื่อคำถามนั้นคุ้มค่าที่จะ search


ที่มา:

  • Suganthan Mohanadasan, “How ChatGPT Actually Picks Sources (I Read The Network Traffic, Not The Outputs)” — Search Engine Journal, June 30, 2026
  • arXiv 2606.25787 — “How Large Language Models Source Brand Reputation Across Languages and Markets”