โรงงานอุตสาหกรรมทุกแห่งผลิตข้อมูลมหาศาลทุกวินาที — เซ็นเซอร์สั่นสะเทือน กล้องตรวจสอบคุณภาพ เครื่องวัดอุณหภูมิและแรงดัน — แต่ข้อมูลเหล่านี้ กว่า 95% เป็นข้อมูลปกติที่ไม่มีป้ายกำกับ (unlabeled data) การจะนำข้อมูลเหล่านี้ไปฝึกโมเดลตรวจจับตำหนิแบบมีผู้สอน (supervised) ต้องเสียเวลาและบุคลากรผู้เชี่ยวชาญในการระบุตำหนิทีละภาพ ซึ่งช้าและมีค่าใช้จ่ายสูง Self-Supervised Learning (SSL) คือวิธีที่ทำให้ AI เรียนรู้รูปแบบที่ซ่อนอยู่จากข้อมูลไร้ป้ายเหล่านี้ได้ด้วยตัวมันเอง
Self-Supervised Learning คืออะไร?
SSL เป็นเทคนิคที่สร้าง “สัญญาณการเรียนรู้” ขึ้นมาจากโครงสร้างของข้อมูลเอง โดยไม่ต้องมีมนุษย์มาติดป้ายกำกับ ระบบจะตั้ง ภารกิจหลอก (pretext task) ให้โมเดลทำนายส่วนหนึ่งของข้อมูลจากส่วนอื่น เช่น ทายทิศทางการหมุนของภาพ หรือเติมส่วนที่ถูกปิดไว้ (masked) จากการทำภารกิจเหล่านี้ โมเดลเรียนรู้ การแทนคุณลักษณะ (representation) ที่สามารถนำไปใช้ต่อกับงานจริงได้ โดยใช้ข้อมูลที่มีป้ายนิดเดียวในขั้นปรับแต่งสุดท้าย (fine-tuning)
🧠 เหตุผลสำคัญ: ผลงานวิจัยพบว่าโมเดลที่ผ่านการฝึกแบบ self-supervised สามารถบรรลุประสิทธิภาพใกล้เคียงหรือบางครั้งสูงกว่า supervised learning ในงานตรวจจับความผิดปกติ ในขณะที่ใช้ข้อมูลที่มีป้ายน้อยลงมาก
วิธีการหลักของ SSL ในงานอุตสาหกรรม
- Contrastive Learning: สอนโมเดจับคู่ข้อมูลที่ “คล้ายกัน” (เช่น ภาพผลิตภัณฑ์ปกติสองมุม) ให้อยู่ใกล้กันในเวกเตอร์สเปซ และดันข้อมูลที่ “ต่างกัน” ให้ออกห่าง เป็นวิธียอดนิยมในการสร้างโมเดลพื้นฐานที่แยกแยะตำหนิได้
- Masked Modeling: ปิดบางส่วนของสัญญาณเซ็นเซอร์หรือภาพแล้วให้โมเดลเติมให้ถูกต้อง เหมาะกับข้อมูลอนุกรมเวลา (time-series) จากเครื่องจักร
- Synthetic Anomaly: ฉีดตำหนิสังเคราะห์ลงในภาพปกติเพื่อสร้างข้อมูลฝึก เนื่องจากตำหนิจริงในโรงงานมีน้อยมาก เทคนิคนี้ช่วยให้ตรวจจับตำหนิได้โดยไม่ต้องรอสะสมตัวอย่างตำหนิจริง
- Predictive / Reconstruction: ให้โมเดลเรียนรู้สร้างภาพซ้ำจากข้อมูลปกติ เมื่อเจอข้อมูลผิดปกติโมเดลจะ “สร้างได้ไม่ดี” ส่งสัญญาณว่าพบความผิดปกติ
เปรียบเทียบกระบวนทัศน์การเรียนรู้
| มิติเปรียบเทียบ | Supervised | Unsupervised | Self-Supervised |
|---|---|---|---|
| ต้องมีป้ายกำกับ? | ✅ มาก | ❌ ไม่มี | ป้ายน้อย (final step) |
| ใช้ประโยชน์จากข้อมูลไร้ป้าย | ❌ | ✅ | ✅ ดีมาก |
| ตรวจจับตำหนิประเภทใหม่ | ❌ (ต้องเคยเห็น) | ปานกลาง | ✅ ได้ดี |
| คุณภาพ representation | ดี (งานเฉพาะ) | ต่ำ-ปานกลาง | ✅ ดีมาก |
| ภาระการติดป้ายมนุษย์ | สูงมาก | ไม่มี | ต่ำ |
กรณีประยุกต์ใช้ในโรงงาน
- ตรวจจับตำหนิที่ไม่เคยพบ (Novel Anomaly Detection): โมเดลที่เรียนรู้แต่ “ความปกติ” จากภาพผลิตภัณฑ์ดีหลายหมื่นภาพ สามารถตั้งค่าระดับความผิดปกติได้รวดเร็ว โดยไม่ต้องรอสะสมตัวอย่างตำหนิทุกประเภท ลดช่องว่างระหว่างการติดตั้งระบบกับการใช้งานจริง
- การระบุตำแหน่งตำหนิ (Defect Localization): เทคนิค reconstruction แผนที่ความแตกต่างระหว่างภาพจริงกับภาพที่โมเดลสร้างขึ้น ชี้ให้เห็นตำแหน่งที่น่าสงสัยบนชิ้นงานโดยตรง
- การสกัดคุณลักษณะสำหรับงานประมวลผล: representation ที่ได้จาก SSL สามารถนำไปใช้เป็นพื้นฐานให้งานพยากรณ์บำรุงรักษาและการจำแนกสภาวะเครื่องจักรได้ดีขึ้น
ข้อควรพิจารณาและความท้าทาย
แม้ SSL มีข้อได้เปรียบชัดเจน แต่ก็มีความท้าทายในการใช้งานจริง การออกแบบ pretext task ที่เหมาะสมกับแต่ละประเภทข้อมูลต้องการความเชี่ยวชาญด้านวิศวกรรม โมเดล SSL มักต้องการทรัพยากรคอมพิวต์สูงในขั้นฝึกเบื้องต้น และการเลือกเกณฑ์ความผิดปกติ (anomaly threshold) ที่เหมาะสมยังเป็นศิลปะที่ต้องปรับจูนตามบริบทของแต่ละสายการผลิต นอกจากนี้ความแปรปรวนของกระบวนการผลิต เช่น การเปลี่ยนวัตถุดิบหรือสีฉาบ อาจทำให้สิ่งที่ “ปกติ” เปลี่ยนไป จำเป็นต้องมีกระบวนการอัปเดตโมเดลอย่างสม่ำเสมอเพื่อหลีกเลี่ยงการแจ้งเตือนผิด (false alarm)
Key Takeaways
- SSL ทำให้ AI เรียนรู้จาก ข้อมูลไร้ป้าย ซึ่งมีอยู่มหาศาลในโรงงาน ลดภาระการติดป้ายของมนุษย์
- วิธีหลักได้แก่ Contrastive Learning, Masked Modeling, Synthetic Anomaly และ Reconstruction
- เหนือกว่า Supervised ในด้าน การใช้ประโยชน์จากข้อมูล การตรวจจับตำหนิใหม่ และการลดภาระติดป้าย
- เหมาะกับงานตรวจจับตำหนิ การระบุตำแหน่งตำหนิ และการสกัดคุณลักษณะสำหรับงานพยากรณ์
- ความท้าทายหลักคือการออกแบบ pretext task การใช้ทรัพยากรคอมพิวต์ และการตั้งค่าเกณฑ์ความผิดปกติที่เหมาะสม
- ต้องมีกระบวนการอัปเดตโมเดลอย่างต่อเนื่อง เพื่อรับมือกับการเปลี่ยนแปลงของกระบวนการผลิตและหลีกเลี่ยงการแจ้งเตือนผิด
