ChatGPT เลือกแหล่งข้อมูลยังไง? เปิด Network Traffic ดูของจริง
ChatGPT เลือกแหล่งข้อมูลยังไง? เปิด Network Traffic ดูของจริง
การตลาดยุคใหม่ต้องเข้าใจว่า AI “เห็น” เรายังไง — ไม่ใช่แค่ Google Rank เท่านั้น
ถ้าคุณเป็นคนทำ SEO หรือ Content Marketing คุณคงเคยได้ยินคำถามนี้:
“ทำยังไงให้แบรนด์เราโผล่ใน ChatGPT?”
คำตอบที่เราได้ยินซ้ำๆ คือ “เขียนคอนเทนต์ดีๆ”, “ทำลิสต์icle”, “ไปเม้น Reddit” — แต่ไม่มีใครเคยบอกว่า เราไปอ่าน network traffic ของ ChatGPT จริงๆ ดูไหมว่า mechanism มันทำงานยังไง?
Suganthan Mohanadasan (Co-founder Snippet Digital) ทำแบบนั้นแหละ เขานั่งอ่าน JSON ที่ ChatGPT ส่งไปมายังบราวเซอร์ของเขา — ไม่ใช่แค่อ่าน output ที่เราเห็น แต่ดู layer ลึกลงไปว่า ChatGPT ตัดสินใจดึงข้อมูลจากที่ไหน และใช้เกณฑ์อะไร
นี่คือสิ่งที่เขาค้นพบ
📚 สารบัญ
- 4 ชั้นของผลลัพธ์ที่ ChatGPT ใช้
- 6 ประเภทคำถาม — บางประเภทไม่ Search เลย
- Fan-out Queries: 1 คำถาม → 40 การค้นหา
- Fetched ≠ Cited ≠ Mentioned
- สิ่งที่ ChatGPT มองไม่เห็น
- ทำยังไงให้แบรนด์คุณโดนเลือก?
- สรุป Actionable Takeaways
4 ชั้นของแหล่งข้อมูลใน ChatGPT

ใน network traffic ของ ChatGPT มี field หนึ่งชื่อ result_source — มันถูกติดไว้กับทุก web result ที่ ChatGPT ดึงมา โดยคุณไม่มีทางเห็น field นี้ใน answer ปกติ
result_source มี 4 ค่า:
| result_source | มันคืออะไร | ตัวอย่าง |
|---|---|---|
| serp | Open web baseline — ส่วนใหญ่เป็นข่าว | Yahoo, StreetInsider |
| labrador | Allowlist ของ publishers ที่มีดีลกับ OpenAI | Reuters, WSJ, FT, Wikipedia, arXiv |
| bright | Bright Data — commercial web scraper | Reddit, Forbes, rtings |
| oxylabs | Oxylabs — คู่แข่ง Bright Data | Gulf News, Khaleej Times, regional press |
labrador คือ licensed tier — ถ้าคุณไม่ได้เป็นเจ้าของหนังสือพิมพ์ระดับประเทศ ก็เข้า tier นี้ไม่ได้
bright กับ oxylabs คือคู่หูที่ ChatGPT จ้างมา crawl เว็บให้ โดย bright ทำหน้าที่หลักใน commercial, shopping, finance, weather ส่วน oxylabs เก็บบริเวณ regional และ local press
ใน query เดียว — เช่นถามสภาพอากาศ — ChatGPT ดึงข้อมูลจากหลาย pipeline พร้อมกัน: metoffice.gov.uk ผ่าน bright, khaleejtimes.com ผ่าน oxylabs
📌 GEO Takeaway
คุณแข่งขันใน scraped tier (bright + oxylabs) ดังนั้น:
- ทำให้เว็บคุณ cleanly scrapable — ข้อมูล ตัวเลข ราคา ต้องอยู่ใน plain HTML text
- อย่าซ่อนไว้ใน script, PDF, หรือ image — scrapers อ่านไม่ได้
- สร้าง third-party coverage, PR, และ brand mentions — นี่คือทางเข้า scraper ที่จะเจอคุณ
6 ประเภทคำถาม — บางประเภทไม่ Search เลย
ChatGPT มี field turn_use_case ที่จัดประเภทคำถามของคุณก่อนว่าจะ search หรือไม่:
- instant search — ค้นหาทั่วไป
- shopping — ค้นหาสินค้า
- text — ไม่ search เลย, ตอบจาก training data
- local — ค้นหารอบตัว
- thinking — reasoning mode, ค้นหาเชิงลึก
- image generation — สร้างภาพ
ประเภทที่ต้องสนใจมากที่สุดคือ text
เมื่อ ChatGPT จัดคำถามคุณเป็น text — มันจะไม่ search เลย มันตอบจากความจำใน training data คำถามประเภท how-to, definition, translation — แม้แต่ “latest treatment guidelines for type 2 diabetes” ก็ถูกจัดเป็น text!
ใน 10 คำถามปัจจุบันที่เขาทดสอบ — 3 คำถามถูกจัดเป็น text และตอบจาก training data โดยไม่ search เลย
การตัดสินใจขึ้นอยู่กับ wording ไม่ใช่ topic — “best coffee near me” → local pipeline, “best 4K TVs to buy” → shopping แต่ “best 4K TVs with reviews” → normal search
📌 GEO Takeaway
ก่อนลงทุนทำหน้า page หนึ่ง — เช็คก่อนว่าคำถามนี้ ChatGPT search จริงๆ หรือตอบจาก training data
ถ้ามันถูกจัดเป็น text — ไม่มี page ไหนในโลกเข้าไปได้ เพราะ ChatGPT ไม่ได้ search เลย ต้องใช้เวลาสร้าง authority และรอให้แบรนด์คุณถูกรวมใน training data รอบหน้า
Fan-out Queries: 1 คำถาม → 40 การค้นหา

ChatGPT เปิดเผย search queries ที่มันรันผ่าน API — และใน Thinking mode 1 คำถามกลายเป็นการค้นหาย่อย 15-40 ครั้ง
ตัวอย่างของ query เปรียบเทียบ pricing เครื่องมือ AI visibility:
"Profound AI search visibility pricing AI engines tracked 2026"
"AthenaHQ pricing AI search visibility tool"
"site:peec.ai/pricing Peec AI Starter Pro Advanced 50 prompts 150 prompts"
"Peec AI pricing $95 $245 $495 official" ← เดาราคาแล้ว search ยืนยัน
"Scrunch AI pricing" ← ไม่ได้อยู่ใน prompt แต่เจอระหว่างค้น
...รวม ~40 queries
สามสิ่งที่โดดเด่น:
- ChatGPT ยิง
site:probes ตรงไปที่ vendor pricing pages - มัน เดาราคา แล้ว search เพื่อยืนยัน
- มัน widen ไปเรื่อยๆ — เจอ tool ที่คุณไม่ได้ถามถึง ก็ chase pricing ต่อ
📌 GEO Takeaway
- ตัวเลขสำคัญต้องอยู่ใน plain HTML text — โดยเฉพาะ pricing เพราะ ChatGPT grep หา
$และ€ - JavaScript-based toggle และ dynamic data loading = ตาย เพราะ ChatGPT อ่านไม่เจอ
- เขียนให้ตรงกับ query ที่ ChatGPT รัน จริง — ไม่ใช่คำค้นของมนุษย์
- ถ้า pricing ของคุณซ่อนใน JS — ChatGPT จะยอมแพ้แล้วไป quote G2 แทน
Fetched ≠ Cited ≠ Mentioned
นี่คือความแตกต่างที่คนสับสนมากที่สุด — สามสิ่งนี้ไม่เหมือนกัน:
- Fetched — ChatGPT ดึงหน้าคุณเข้ามาใน context (user ไม่เห็น)
- Cited — ใส่ URL ของคุณเป็น source ข้างหลัง specific sentence
- Mentioned — ชื่อแบรนด์คุณโผล่ใน answer (อาจเป็น chip ลิงก์เว็บคุณ)
คุณสามารถชนะหรือแพ้แต่ละอย่างได้โดยอิสระ
ในการทดสอบของ Suganthan — Reddit ถูก fetch 278 ครั้ง แต่ cited แค่ 11 ครั้ง ส่วน YouTube ถูก fetch 201 ครั้ง แต่ ไม่เคยถูก cited เลยสักครั้ง
สาเหตุ: citation ต้อง bind กับ text ที่ model อ่านได้จริง — YouTube page ให้แค่ metadata (title, description) ไม่ใช่ transcript ส่วน Reddit มี text ให้ quote เต็มๆ
📌 GEO Takeaway
- คุณ cite ตัวเองไม่ได้ — claim เกี่ยวกับคุณ ต้องมี third-party coverage
- เน้น content ที่เป็น text (Reddit, blog, review sites) มากกว่า video
- 1 หน้าที่แข็งแรง ดีกว่า 20 หน้าที่บาง — ChatGPT dedup by domain
- ราคาและ spec ของคุณควรอ่านได้จากหน้าของคุณเอง ไม่งั้นมือไป G2
สิ่งที่ ChatGPT มองไม่เห็น — และทำไม G2 ถึงได้ cited
ChatGPT เก็บ chain of thought ไว้ใน conversation — และมันอธิบายการเลือก sources ด้วยคำพูดของมันเอง:
“pricing page seems more current, so I should cite that”
“the pricing isn’t showing up directly in the search result, possibly because it’s loaded with JavaScript”
“I can quote third-party sources since the official page is hard to parse and doesn’t show prices”
“use citations from G2 where appropriate”
นี่คือเกมทั้งเกมใน trace เดียว — ChatGPT อยาก cite official page แต่ถ้า official page อ่านไม่ได้ (JS, image-based pricing) — มันจะ fallback ไปที่ G2 และ third-party sites
ข้อควรรู้เพิ่มเติม:
- ไม่มี ranking score หรือ domain authority ใน traffic ที่ browser เห็น — ใครขาย “ChatGPT ranking factors” คือขายน้ำมันงู
- Personalization มีจริง — ChatGPT ดึง conversation history คุณมาใช้ใน answer (field:
personal_sources: ["convo_search", "gmail", "files"]) - Local results ถูก capped ที่ 2 — ถ้าถามร้านกาแฟใกล้ฉัน ได้แค่ 2 ที่ ไม่ใช่ top 10
สรุป Actionable Takeaways
| สิ่งที่ต้องทำ | เหตุผล |
|---|---|
| ✅ ทำให้เว็บ cleanly scrapable | ข้อมูล ราคา spec ต้องอยู่ใน plain HTML — scrapers อ่าน JS ไม่ได้ |
| ✅ สร้าง third-party coverage | 85% ของ citations มาจาก third-party sources — PR, Reddit, review sites |
| ✅ เขียนเพื่อ query ที่ ChatGPT รันจริง | ChatGPT ไม่ได้ใช้คำค้นมนุษย์ — มัน rephrase และยิง site: probes |
| ✅ เน้น text-based content | YouTube ถูก cited = 0 — Reddit ถูก cited ตลอด |
| ✅ 1 หน้าที่แข็งแรง ดีกว่า 20 หน้าบาง | ChatGPT dedup by domain |
| ❌ อย่าซ่อน pricing ไว้ใน JS | ChatGPT จะยอมแพ้และไป cite G2 แทน |
| ❌ อย่าลงทุนกับคำถามที่ ChatGPT ไม่ search | เช็คก่อนว่าคำถามของคุณถูกจัดเป็น text หรือไม่ |
ทิ้งท้าย: ChatGPT ไม่ใช่ search engine ดังนั้นหยุด optimize เหมือนทำ SEO บน Google มันอ่านหน้า คุณเพื่อหาข้อเท็จจริง และอ่าน third-party เพื่อหาความคิดเห็น — และมันจะทำอย่างนั้นก็ต่อเมื่อคำถามนั้นคุ้มค่าที่จะ search
ที่มา:
- Suganthan Mohanadasan, “How ChatGPT Actually Picks Sources (I Read The Network Traffic, Not The Outputs)” — Search Engine Journal, June 30, 2026
- arXiv 2606.25787 — “How Large Language Models Source Brand Reputation Across Languages and Markets”