Dr. Layla
. ?
ทุกสัปดาห์มีพาดหัวข่าวใหม่อ้างว่า AI แซงหน้าความสามารถของมนุษย์ในบางด้าน คุณประเมินข้ออ้างเหล่านั้นอย่างไร
Dr. Fawaz
. , . .
ด้วยความสงสัยอย่างมาก ตัวชี้วัดส่วนใหญ่วัดงานแคบๆ ที่กำหนดไว้ดีภายใต้เงื่อนไขที่ควบคุม ประสิทธิภาพในโลกจริงยุ่งเหยิงกว่าและน่าประทับใจน้อยกว่ามาก
Dr. Layla
. . ?
ลองพูดถึงโมเดลภาษาขนาดใหญ่โดยเฉพาะ มันสร้างข้อความที่คล่องแคล่วน่าทึ่ง ความคล่องแคล่วหมายถึงความเข้าใจไหม
Dr. Fawaz
, . . .
ไม่ และการสับสนระหว่างสองสิ่งนี้เป็นความเข้าใจผิดที่ฝังรากลึกที่สุด โมเดลที่ฝึกมาเพื่อทำนายโทเค็นถัดไปเรียนรู้รูปแบบทางสถิติในภาษา มันสามารถสร้างร้อยแก้วที่สอดคล้องเกี่ยวกับหัวข้อที่ไม่เคยใช้เหตุผลอย่างแท้จริง
Dr. Layla
— .
แต่โมเดลเหล่านี้ดูเหมือนจะสรุปความได้ มันตอบคำถามเกี่ยวกับสถานการณ์ที่ไม่มีในข้อมูลฝึก
Dr. Fawaz
. — , , .
บางส่วนของนั้นเป็นการประมาณค่าที่น่าประทับใจภายในการกระจายของข้อมูลฝึก ความล้มเหลวเกิดขึ้นที่ขอบ ห่วงโซ่การใช้เหตุผลใหม่ การอนุมานหลายขั้นตอนที่ต่อเนื่อง การเชื่อมโยงภาษากับโลกที่เปลี่ยนแปลง
Dr. Layla
, ?
คุณเห็นคุณค่าที่แท้จริงและยั่งยืนจากระบบ AI ปัจจุบันที่ไหน
Dr. Fawaz
. , , — .
การเพิ่มประสิทธิภาพงานของมนุษย์ที่มีทักษะ การร่างเวอร์ชันแรก การสรุปเอกสารขนาดใหญ่ การสร้างโค้ดต้นแบบให้วิศวกรตรวจสอบ สิ่งเหล่านี้คือการเพิ่มผลผลิตจริงโดยไม่พูดเกินจริงถึงความเป็นอิสระของเครื่อง
Dr. Layla
?
แล้วความเสี่ยงที่คุณกังวลที่สุดล่ะ
Dr. Fawaz
. , . — , .
การพึ่งพามากเกินไปและการสึกกร่อนของการประเมินวิจารณ์ เมื่อผลลัพธ์คล่องแคล่วและมั่นใจ ผู้ใช้หยุดตั้งคำถาม นั่นคือที่ที่ความเสียหายรวมตัวกัน ไม่ใช่ในสถานการณ์ที่ดราม่า แต่ในข้อผิดพลาดของการยอมตามที่เงียบงันและสะสม
Dr. Layla
. .
นั่นเป็นความแตกต่างที่สำคัญ เทคโนโลยีไม่ใช่อันตรายมากเท่ากับนิสัยขององค์กรที่ก่อตัวรอบๆ มัน
Dr. Fawaz
. , , .
แน่นอน นั่นเป็นเหตุผลว่าทำไมการวิจัยความสามารถในการตีความ กรอบการตรวจสอบ และกลไกการกำกับดูแลของมนุษย์จึงสำคัญอย่างน้อยเท่ากับการปรับปรุงความสามารถ