← Indonesian conversations Indonesian · technology · advanced · 183 words · ~1 min
Model Bahasa Besar dan Batas Kemampuannya
โมเดลภาษาขนาดใหญ่และขีดจำกัดความสามารถ
Large Language Models and Their Limitations
Two AI researchers critically examine the capabilities and fundamental limitations of large language models.
Sign in to save texts and track what you've read.
Dr. Faruq . ? โมเดลภาษาขนาดใหญ่ในปัจจุบันสร้างข้อความที่ดูชาญฉลาดมาก นี่คือความเข้าใจภาษาจริงๆ หรือแค่สถิติที่ซับซ้อนมาก
Dr. Layla . ; . คำถามเชิงปรัชญาที่ลึกซึ้ง โมเดลเหล่านั้นไม่มีความเข้าใจความหมายที่แท้จริง พวกมันแค่ทำนาย token ถัดไปตามการกระจายความน่าจะเป็นจากข้อมูลการฝึก
Dr. Faruq . . แต่พวกมันสามารถแก้โจทย์คณิตศาสตร์และเขียนโค้ดที่ใช้งานได้ นั่นเกินกว่าแค่การทำนาย token ธรรมดา
Dr. Layla , . . จริง ความสามารถที่เกิดขึ้นจากขนาดทำให้เกิดสมรรถนะที่ไม่ได้ถูกโปรแกรมไว้อย่างชัดเจน แต่โมเดลยังล้มเหลวในการใช้เหตุผลแบบผสมผสานใหม่และความสอดคล้องของข้อเท็จจริงในระยะยาว
Dr. Faruq . ? การ hallucination เรื่องข้อเท็จจริงยังเป็นปัญหาร้ายแรง เทคนิค retrieval-augmented generation แก้ปัญหานี้ได้เพียงพอแล้วหรือยัง
Dr. Layla , . RAG ลด hallucination ในโดเมนที่กำหนดไว้ชัดเจน แต่ไม่ได้แก้ปัญหาพื้นฐานของความไม่แน่นอนทางญาณวิทยาของโมเดลต่อขีดจำกัดความรู้ของตัวเอง
Dr. Faruq ? ? แล้วแนวทาง constitutional AI เพื่อความสอดคล้องกับค่านิยมล่ะ เชื่อถือได้แค่ไหน
Dr. Layla , . . น่าสัญญา แต่ alignment ยังคงเป็นพื้นที่วิจัยเปิด ค่านิยมที่เข้ารหัสใน constitution ของ AI อาจขัดแย้งกันในกรณีขอบที่ไม่คาดคิด
Dr. Faruq . , ? น่าสนใจ ในความเห็นของคุณ งานวิจัยอะไรเร่งด่วนที่สุดที่ต้องทำตอนนี้
Dr. Layla . . การตีความเชิงกลไก เราต้องเข้าใจอย่างโปร่งใสว่าอะไรเกิดขึ้นจริงๆ ภายในโมเดลก่อนที่จะนำไปใช้ในโดเมนที่สำคัญ
colour key NounVerbAdjectiveAdverbPronounParticleConjunctionDeterminer