林博士
,。
ช่วงนี้โมเดลภาษาขนาดใหญ่พัฒนาเร็วมาก แต่หลายคนยังไม่เข้าใจหลักการทำงานของมัน
方研究员
,,,。
ใช่ พูดง่ายๆ คือโมเดลภาษาขนาดใหญ่คือโมเดลความน่าจะเป็นที่ฝึกบนข้อความจำนวนมหาศาล โดยแต่ละครั้งจะทำนายคำที่มีโอกาสเป็นไปได้มากที่สุดถัดไป
林博士
?
การออกแบบเช่นนี้มีข้อจำกัดพื้นฐานอะไรบ้าง?
方研究员
“”,,。
ปัญหาที่ชัดเจนที่สุดคือ "ภาพหลอน" โดยโมเดลจะสร้างเนื้อหาที่ฟังดูสมเหตุสมผลแต่ผิดจริงๆ เพราะมันปรับให้ภาษาลื่นไหล ไม่ใช่ปรับให้ถูกต้องตามข้อเท็จจริง
林博士
??
แล้วความสามารถในการใช้เหตุผลล่ะ? โมเดลใช้เหตุผลจริงๆ ไหม?
方研究员
,,。
ในแวดวงวิชาการยังมีข้อถกเถียงอยู่ งานวิจัยบางส่วนเชื่อว่าโมเดลกำลังทำการดำเนินการเชิงสัญลักษณ์บางอย่าง แต่มันขาดความเข้าใจเชิงเหตุและผลและโมเดลโลกที่แท้จริง
林博士
?
ข้อจำกัดของหน้าต่างบริบทส่งผลต่อการใช้งานจริงอย่างไร?
方研究员
,,,。
ยิ่งหน้าต่างยาว ต้นทุนการคำนวณความสนใจยิ่งเพิ่มขึ้นแบบกำลังสอง ข้อมูลที่เกินหน้าต่างโมเดลมองไม่เห็นเลย การประมวลผลเอกสารยาวเป็นความท้าทายที่ยังคงมีอยู่
林博士
?
การสร้างข้อมูลเสริมด้วยการดึงข้อมูล (RAG) เป็นทางออกหนึ่งไหม?
方研究员
,,,。
เป็นทิศทางที่มีแนวโน้มดีมาก ให้โมเดลดึงความรู้จากฐานข้อมูลภายนอกระหว่างการอนุมาน ช่วยบรรเทาปัญหาภาพหลอนและความรู้ที่ถูกตัดออก แต่วิธีการดึงและรวมข้อมูลอย่างมีคุณภาพยังคงเป็นจุดวิจัยที่ร้อนแรง
林博士
?
คุณคิดว่าทิศทางการก้าวกระโดดในอนาคตจะอยู่ที่ไหน?
方研究员
、,,。
ฉันให้ความสนใจเป็นพิเศษกับการทำความเข้าใจแบบหลายรูปแบบ การใช้เหตุผลระยะยาว และการวัดปริมาณความไม่แน่นอนที่ดีขึ้น ถ้าทั้งสามทิศทางนี้มีความก้าวหน้า ความเป็นประโยชน์ในทางปฏิบัติจะเพิ่มขึ้นอย่างมีนัยสำคัญ