เจาะลึกการสร้างสมองที่สองให้ธุรกิจด้วยเทคนิค RAG ฉบับจับมือทำจริง

รู้จักกับ RAG กุญแจสำคัญที่ทำให้ AI เข้าใจธุรกิจของคุณ

สวัสดีครับเพื่อน ๆ นักอ่านทุกท่าน ผม Natt.Tech เองครับ กลับมาพบกันอีกครั้งในพื้นที่แห่งการเรียนรู้เทคโนโลยีที่ผมตั้งใจย่อยให้เคี้ยวง่ายที่สุด วันนี้ผมจะพาทุกท่านไปดำดิ่งสู่หัวข้อที่กำลังร้อนแรงที่สุดในวงการ Data Science และ Generative AI นั่นก็คือเรื่องของ RAG หรือ Retrieval-Augmented Generation ครับ

เคยไหมครับที่ลองถาม ChatGPT หรือ AI ตัวเก่ง ๆ เกี่ยวกับนโยบายบริษัทของคุณ หรือถามถึงสินค้าตัวใหม่ล่าสุดที่เพิ่งเปิดตัวเมื่อวาน แล้วคำตอบที่ได้คือความเงียบ หรือแย่กว่านั้นคือการ “มั่ว” คำตอบออกมาอย่างมั่นใจ (ที่เราเรียกกันว่า Hallucination) สาเหตุที่เป็นแบบนั้นเพราะโมเดลภาษาขนาดใหญ่ (LLM) เหล่านี้ถูกเทรนมาด้วยข้อมูลสาธารณะจนถึงช่วงเวลาหนึ่งเท่านั้นครับ มันไม่ได้รู้จักฐานข้อมูลภายในบริษัทของเรา

ในฐานะที่ผมคลุกคลีอยู่กับ Machine Learning มากว่า 10 ปี ผมบอกได้เลยว่า RAG คือ Game Changer ของจริงครับ ลองจินตนาการว่า LLM คือนักเรียนระดับอัจฉริยะที่เก่งมากแต่ไม่ได้อ่านหนังสือสอบวิชาเฉพาะทางของบริษัทคุณ การทำ RAG ก็เหมือนกับการที่เราอนุญาตให้เด็กอัจฉริยะคนนี้ “เปิดหนังสือสอบ” (Open Book Exam) โดยเรายื่นคู่มือ เอกสาร หรือข้อมูลที่ถูกต้องให้เขาอ่านก่อนตอบคำถาม ผลลัพธ์ที่ได้คือคำตอบที่ฉลาด เรียบเรียงดี และที่สำคัญคือ “ถูกต้องตามข้อมูลจริง” ของเราครับ

ในบทความนี้ ผมจะไม่แค่มาเล่าทฤษฎีให้ฟังแล้วจบไป แต่เราจะมาดูขั้นตอนแบบ How-to ทีละสเต็ปว่า ถ้าคุณอยากสร้างระบบ RAG ขึ้นมาใช้งานจริงในองค์กร หรือทำเป็นโปรเจกต์ส่วนตัว คุณต้องเริ่มจากตรงไหนและทำอย่างไรบ้าง เตรียมกาแฟให้พร้อม แล้วลุยกันเลยครับ

เตรียมข้อมูลให้พร้อม ขั้นตอนแรกที่สำคัญที่สุด

ในวงการข้อมูลเรามีคำกล่าวสุดคลาสสิกว่า “Garbage In, Garbage Out” หรือถ้าแปลไทยบ้าน ๆ คือ “เอาขยะเข้าไป ก็ได้ขยะออกมา” ครับ การทำ RAG ก็เช่นกัน ความแม่นยำของคำตอบไม่ได้ขึ้นอยู่กับว่าคุณใช้โมเดล AI ที่ฉลาดที่สุดในโลกหรือไม่ แต่อยู่ที่ว่า “ข้อมูลที่คุณป้อนให้มัน” มีคุณภาพแค่ไหน

ขั้นตอนแรกของการทำ RAG คือการรวบรวมข้อมูลที่คุณต้องการให้ AI รู้ (Knowledge Base) ไม่ว่าจะเป็นไฟล์ PDF คู่มือพนักงาน, ไฟล์ Text, ข้อมูลจาก Notion, หรือแม้แต่บทสนทนาเก่า ๆ ใน Slack สิ่งที่ต้องทำคือการ Clean Data ครับ

วิธีการเตรียมข้อมูลแบบฉบับ Natt.Tech มีดังนี้ครับ:

กำจัด Noise: ลบพวก Header, Footer, หรือข้อความซ้ำ ๆ ที่ปรากฏทุกหน้ากระดาษออก เพราะสิ่งเหล่านี้จะทำให้ AI สับสนตอนค้นหาคำตอบ
จัด Format ให้อ่านง่าย: ถ้าเป็นตารางที่ซับซ้อนใน PDF พยายามแปลงให้อยู่ในรูปแบบ Markdown หรือ Text ที่มีโครงสร้างชัดเจน เพราะ LLM เข้าใจโครงสร้างภาษาแบบนี้ได้ดีกว่า
การแบ่งข้อมูล (Chunking): นี่คือศิลปะเลยครับ เราไม่สามารถยัดหนังสือทั้งเล่มให้ AI อ่านรวดเดียวได้ เราต้องหั่นข้อมูลเป็นชิ้นเล็ก ๆ (Chunks) การกำหนดขนาด Chunk size สำคัญมาก ถ้าเล็กไป AI ก็ได้บริบทไม่ครบ ถ้าใหญ่ไปก็อาจจะหลุดประเด็นสำคัญ หรือเกินโควตาของ Token ที่โมเดลรับได้

ผมแนะนำให้เริ่มจากการใช้เครื่องมืออย่าง LangChain หรือ LlamaIndex ซึ่งมีฟังก์ชันช่วยแบ่งข้อความ (Text Splitter) ที่ฉลาดมาก ๆ เช่น แบ่งตามย่อหน้า หรือแบ่งโดยไม่ตัดประโยคให้ขาดตอนครับ การเตรียมข้อมูลที่ดีจะช่วยลดปัญหากวนใจในภายหลังได้กว่า 80% เลยทีเดียว

การแปลงข้อมูลเป็นเวกเตอร์ หัวใจของการค้นหาเชิงความหมาย

เมื่อเราได้ชิ้นส่วนข้อมูลที่สะอาดเอี่ยมอ่องมาแล้ว ขั้นตอนต่อไปคือการทำให้คอมพิวเตอร์เข้าใจความหมายของข้อความเหล่านั้นครับ เราเรียกกระบวนการนี้ว่า Embedding

ปกติคอมพิวเตอร์ไม่เข้าใจภาษาไทยหรือภาษาอังกฤษหรอกครับ มันเข้าใจแต่ตัวเลข สิ่งที่เราต้องทำคือแปลงข้อความ (Text) ให้กลายเป็นชุดตัวเลข (Vector) ลองจินตนาการว่าเรามีแผนที่ขนาดใหญ่ แล้วเราปักหมุดว่าคำว่า “สุนัข” กับ “หมา” ควรจะปักหมุดอยู่ใกล้ ๆ กัน ในขณะที่ “แมว” ก็อยู่ใกล้เข้ามาหน่อย แต่ “รถยนต์” จะไปอยู่อีกมุมหนึ่งของแผนที่เลย

เทคโนโลยีนี้ทำให้เราสามารถทำสิ่งที่เรียกว่า Semantic Search หรือการค้นหาจากความหมายได้ครับ ไม่ใช่แค่การหา Keyword ตรง ๆ เหมือนสมัยก่อน เช่น ถ้า user ถามว่า “นโยบายการเบิกค่ารักษาพยาบาล” ระบบ RAG ที่ดีจะสามารถไปดึงข้อมูลที่มีคำว่า “สวัสดิการสุขภาพ” หรือ “OPD/IPD” มาให้ได้ แม้จะไม่มีคำว่า “รักษาพยาบาล” อยู่ในนั้นเลยก็ตาม

สำหรับการเลือกโมเดล Embedding ในปัจจุบันมีให้เลือกเยอะมากครับ:

OpenAI Embeddings (text-embedding-3): ใช้ง่าย แม่นยำสูง ราคาประหยัด เหมาะสำหรับผู้เริ่มต้น
Hugging Face (Open Source): มีโมเดลภาษาไทยดี ๆ ให้เลือกใช้ฟรีหลายตัว เช่น wangchanberta หรือโมเดล multilingual อื่น ๆ ที่รันบนเครื่องตัวเองได้ เพื่อความปลอดภัยของข้อมูล

เลือกใช้ตามความเหมาะสมของงบประมาณและความเป็นส่วนตัวของข้อมูลได้เลยครับ

เลือก Vector Database คลังสมองสำหรับเก็บความทรงจำ

พอเราแปลงข้อความมหาศาลให้เป็นตัวเลขเวกเตอร์แล้ว เราจะเก็บมันไว้ที่ไหนดี? จะเก็บใส่ Excel หรือ SQL Database ธรรมดาก็คงไม่ไหว เพราะการค้นหาความคล้ายคลึงของเวกเตอร์ (Vector Similarity Search) ต้องใช้การคำนวณที่ซับซ้อนและต้องการความเร็วสูงมากครับ

นี่จึงเป็นที่มาของพระเอกในขั้นตอนนี้คือ Vector Database ครับ ซึ่งเป็นฐานข้อมูลชนิดพิเศษที่ออกแบบมาเพื่อเก็บและค้นหาข้อมูลประเภทเวกเตอร์โดยเฉพาะ หน้าที่ของมันคือ เมื่อมีคำถามเข้ามา มันจะคำนวณหาว่าข้อมูลชิ้นไหนในฐานข้อมูลที่มี “ความหมาย” ใกล้เคียงกับคำถามมากที่สุด แล้วดึงชิ้นส่วนข้อมูลนั้น (Chunks) กลับมาให้เรา

จากประสบการณ์ที่ผมใช้มา มีตัวเลือกที่น่าสนใจแบ่งเป็นกลุ่ม ๆ ดังนี้ครับ:

Pinecone: เป็นแบบ Cloud-managed ดูแลรักษาง่ายมาก ไม่ต้องตั้ง Server เอง สเกลได้ดี แต่มีค่าใช้จ่ายตามปริมาณการใช้งาน
ChromaDB หรือ FAISS: เป็น Open Source ที่ยอดนิยมมาก เหมาะสำหรับรันบนเครื่อง Local หรือ Server องค์กร เหมาะสำหรับโปรเจกต์เริ่มต้นหรือต้องการประหยัดงบ
Weaviate / Qdrant: เป็นตัวเลือกที่มีฟีเจอร์ลูกเล่นเยอะ และรองรับ Hybrid Search (ค้นหาทั้งแบบ Keyword และ Vector ผสมกัน) ซึ่งช่วยเพิ่มความแม่นยำได้ดีเยี่ยม

การเลือก Database ก็เหมือนเลือกบ้านครับ ต้องดูขนาดครอบครัว (ปริมาณข้อมูล) และงบประมาณที่มี ถ้าเป็นโปรเจกต์ทดสอบ (PoC) ผมเชียร์ ChromaDB ครับ เพราะติดตั้งง่ายผ่าน Python แค่บรรทัดเดียวก็ใช้ได้เลย

เชื่อมต่อและประมวลผล การสร้างคำตอบที่แม่นยำ

มาถึงขั้นตอนที่สนุกที่สุดแล้วครับ คือการประกอบร่างทุกอย่างเข้าด้วยกัน (Orchestration) ขั้นตอนนี้คือกระบวนการที่เกิดขึ้นเมื่อ User พิมพ์คำถามเข้ามาครับ

กระบวนการทำงานจะเป็นดังนี้ครับ:

รับคำถาม: User พิมพ์คำถาม เช่น “ขั้นตอนการขอลาพักร้อนทำอย่างไร?”
แปลงคำถาม: ระบบจะแปลงคำถามนี้เป็น Vector ด้วยโมเดล Embedding ตัวเดียวกับที่เราใช้ทำข้อมูล
ค้นหา (Retrieve): เอา Vector คำถามไปค้นใน Vector Database เพื่อหา Chunks ข้อมูลที่เกี่ยวข้องที่สุดมาสัก 3-5 ชิ้น (เราเรียกว่า Top-k Context)
สร้าง Prompt (Augment): นำคำถาม + ข้อมูลที่ค้นเจอ มายัดใส่ Prompt Template เช่น:
“จงตอบคำถามต่อไปนี้โดยใช้ข้อมูลที่ให้มาเท่านั้น (ถ้าไม่รู้ให้ตอบว่าไม่รู้ ห้ามมั่ว):
ข้อมูลอ้างอิง: [ใส่ข้อมูลที่ค้นเจอตรงนี้]
คำถาม: ขั้นตอนการขอลาพักร้อนทำอย่างไร?”
ส่งให้ LLM (Generate): ส่ง Prompt ทั้งก้อนนี้ไปให้ AI (เช่น GPT-4, Claude 3, หรือ Gemini) ประมวลผล

ผลลัพธ์ที่ได้คือ AI จะตอบคำถามโดยอิงจาก “ข้อมูลอ้างอิง” ที่เราแปะไปให้ ทำให้คำตอบนั้นถูกต้องตามระเบียบเป๊ะ ๆ ไม่มีการมั่วข้อมูลภายนอกเข้ามาปนครับ

เทคนิคสำคัญตรงนี้คือ System Prompt Engineering ครับ เราต้องเขียนคำสั่งกำกับให้ชัดเจนว่าให้ AI มีบุคลิกอย่างไร และต้องเคร่งครัดเรื่องข้อมูลแค่ไหน หากเขียน Prompt ดี AI ก็จะทำงานได้เหมือนพนักงานมืออาชีพคนหนึ่งเลยทีเดียว

เทคนิคเสริมความแกร่งให้ระบบ RAG ทำงานได้ดียิ่งขึ้น

แม้ว่าขั้นตอนข้างต้นจะทำให้คุณได้ระบบ RAG พื้นฐานที่ใช้งานได้แล้ว แต่จากประสบการณ์ของ Natt.Tech ปัญหาหน้างานจริงมักจะซับซ้อนกว่านั้นครับ เช่น ข้อมูลที่ดึงมาไม่ตรงประเด็น หรือ AI ตอบกว้างเกินไป ผมจึงมีเทคนิคเสริม (Advanced RAG) มาฝากกันครับ

1. Hybrid Search:
บางครั้งการค้นหาด้วยความหมาย (Vector) อาจจะพลาดคำเฉพาะเจาะจง (Keyword) เช่น รหัสสินค้า หรือชื่อเฉพาะ การใช้ Hybrid Search คือการค้นหาทั้งสองแบบพร้อมกันแล้วนำคะแนนมารวมกัน (Reranking) จะช่วยให้เจาะจงข้อมูลได้แม่นยำขึ้นมากครับ

2. Metadata Filtering:
ถ้าฐานข้อมูลเราใหญ่มาก การใส่ Metadata กำกับไว้ตอนทำ Index ช่วยได้เยอะครับ เช่น กำกับว่า Chunk นี้มาจาก “แผนก HR” หรือ “ปี 2024” เวลาค้นหา เราสามารถกรองเฉพาะข้อมูลของปีล่าสุด หรือเฉพาะแผนกที่เกี่ยวข้องได้ ทำให้ขอบเขตการค้นหาแคบลงและแม่นยำขึ้น

3. Multi-Query Retrieval:
บางครั้ง User ถามคำถามมาแบบงง ๆ หรือสั้นเกินไป เราสามารถให้ AI ช่วยแตกคำถามนั้นเป็นคำถามย่อย ๆ 3-4 รูปแบบ แล้วนำไปค้นหาพร้อมกัน จะช่วยให้เราดึงข้อมูลได้ครอบคลุมบริบทมากขึ้นครับ เหมือนเวลาเราถาม Google แล้วไม่เจอ เราก็ลองเปลี่ยนคำค้นนั่นแหละครับ แต่นี่ AI ทำให้เราอัตโนมัติ

บทสรุปและก้าวต่อไปของการประยุกต์ใช้ AI ในองค์กร

การสร้างระบบ RAG ไม่ใช่เรื่องไกลตัวอีกต่อไปแล้วครับ ด้วยเครื่องมือต่าง ๆ ที่มีในปัจจุบันทำให้เราสามารถสร้าง “สมองที่สอง” ให้กับธุรกิจได้ภายในเวลาไม่กี่วัน การมี AI ที่สามารถตอบคำถามจากข้อมูลภายในองค์กรได้อย่างแม่นยำ จะช่วยลดภาระงานซ้ำซ้อนของพนักงาน เพิ่มความเร็วในการตัดสินใจ และปลดล็อกศักยภาพของข้อมูล (Data Asset) ที่เราเก็บสะสมมานานให้เกิดประโยชน์สูงสุด

แต่สิ่งที่ผม Natt.Tech อยากฝากทิ้งท้ายไว้คือ “เทคโนโลยีเปลี่ยนเร็ว แต่พื้นฐานสำคัญกว่า” อย่าลืมให้ความสำคัญกับคุณภาพของข้อมูล (Data Quality) และจริยธรรมในการใช้งาน AI (AI Ethics) ด้วยนะครับ ตรวจสอบความถูกต้องของคำตอบเสมอ และหมั่นอัปเดตความรู้ใหม่ ๆ อยู่ตลอดเวลา

หวังว่าบทความ How-to นี้จะเป็นเข็มทิศนำทางให้เพื่อน ๆ เริ่มต้นโปรเจกต์ RAG ของตัวเองได้อย่างมั่นใจ หากติดขัดตรงไหน หรืออยากให้เจาะลึกเรื่องอะไรเพิ่มเติม คอมเมนต์บอกกันได้เลยครับ สำหรับวันนี้ขอให้สนุกกับการสร้างสรรค์นวัตกรรมครับ!

เขียนโดย

♂

ณัฐพล วิทยานนท์

Natt.Tech

อดีตนักวิทยาศาสตร์ข้อมูล (Data Scientist) ผู้คร่ำหวอดในวงการเทคโนโลยีมากว่า 10 ปี เชี่ยวชาญพิเศษด้าน Machine Learning และ Generative AI ปัจจุบันเป็นที่ปรึกษาอิสระและเขียนบทความเพื่อย่อยเรื่องเทคโนโลยีซับซ้อนให้เข้าใจง่ายสำหรับธุรกิจ

ดูบทความทั้งหมด →