Product Manager Huda
. .
ทีมของเราต้องการสร้างโมเดลที่ทำนายว่าลูกค้ารายใดมีแนวโน้มจะยกเลิกการสมัครสมาชิก ช่วยอธิบายสิ่งที่เกี่ยวข้องจริงๆ ได้ไหม
Data Scientist Tariq
. , — , , , .
ขั้นตอนแรกและสำคัญที่สุดคือข้อมูล เราต้องการบันทึกประวัติของลูกค้าที่ยกเลิกและไม่ยกเลิก พร้อมกับคุณลักษณะที่อาจอธิบายความแตกต่าง เช่น ความถี่การใช้งาน ประวัติตั๋วสนับสนุน ประเภทแผน อายุสมาชิก
Product Manager Huda
?
ต้องการข้อมูลประวัติมากแค่ไหนจึงจะเพียงพอ
Data Scientist Tariq
. , . .
ขึ้นอยู่กับความซับซ้อนของโมเดลและอัตราส่วนสัญญาณต่อสัญญาณรบกวนในคุณลักษณะ สำหรับงานจำแนกประเภทที่ค่อนข้างง่าย ตัวอย่างที่มีป้ายกำกับสองสามพันตัวที่มีการออกแบบคุณลักษณะดีก็เพียงพอ สำหรับวิธีการเรียนรู้เชิงลึกคุณมักต้องการข้อมูลมากกว่านั้นหลายเท่า
Product Manager Huda
, ?
เมื่อมีข้อมูลแล้ว ต่อไปทำอะไร
Data Scientist Tariq
, , . , , .
เราแบ่งมันเป็นชุดฝึก ชุดตรวจสอบ และชุดทดสอบ โมเดลเรียนรู้รูปแบบจากชุดฝึก เราปรับพารามิเตอร์กับชุดตรวจสอบ และวัดประสิทธิภาพสุดท้ายกับชุดทดสอบที่โมเดลไม่เคยเห็น
Product Manager Huda
'' ?
'การเรียนรู้' หมายความว่าอะไรในเชิงกลไก
Data Scientist Tariq
, , — — . .
โมเดลทำการทำนาย เปรียบเทียบกับคำตอบที่ถูกต้องที่รู้จัก คำนวณค่าสูญเสีย ซึ่งเป็นการวัดว่ามันผิดมากแค่ไหน และปรับพารามิเตอร์ภายในเพื่อลดค่าสูญเสียนั้น วงจรนี้ซ้ำหลายพันหรือหลายล้านครั้ง
Product Manager Huda
?
รูปแบบความล้มเหลวที่พบบ่อยที่สุดหลังการติดตั้งใช้งานคืออะไร
Data Scientist Tariq
. . — , , — .
การเปลี่ยนแปลงการกระจายเป็นสิ่งที่ร้ายแรงที่สุด โมเดลถูกฝึกบนรูปแบบประวัติ ถ้าพฤติกรรมลูกค้าเปลี่ยนแปลง เช่น คุณลักษณะผลิตภัณฑ์ใหม่ การเปลี่ยนแปลงทางเศรษฐกิจ พลวัตการแข่งขัน สมมติฐานของโมเดลไม่ถือผลอีกต่อไปและประสิทธิภาพจะลดลงอย่างเงียบๆ
Product Manager Huda
.
ดังนั้นการตรวจสอบอย่างต่อเนื่องไม่ใช่ทางเลือก
Data Scientist Tariq
. . . .
เป็นสิ่งที่ขาดไม่ได้ ติดตามความแม่นยำของการทำนายกับความจริงภาคพื้นดินบนพื้นฐานต่อเนื่อง ตั้งการแจ้งเตือนเมื่อประสิทธิภาพลดลงต่ำกว่าเกณฑ์ และวางแผนสำหรับการฝึกใหม่เป็นระยะแทนที่จะมองโมเดลเป็นสิ่งประดิษฐ์ครั้งเดียว