TinyML คืออะไร? เมื่อ AI ลงไปอยู่บนไมโครคอนโทรลเลอร์
TinyML หรือ Tiny Machine Learning คือการนำโมเดล Machine Learning มาทำงานบนไมโครคอนโทรลเลอร์ขนาดเล็ก (Microcontroller Unit หรือ MCU) ที่มี RAM เพียง 32-512 KB และ Flash Memory ไม่เกิน 2 MB ต่างจาก AI แบบดั้งเดิมที่ต้องพึ่ง Cloud Server ด้วยกำลังประมวลผลหลาย TFLOPS TinyML ทำให้อุปกรณ์ IoT ราคาประหยัดสามารถ “คิดเองได้” โดยไม่ต้องเชื่อมต่อ Internet
ในบริบทของโรงงานอุตสาหกรรม TinyML เปิดโอกาสให้ Sensor Node แต่ละจุดสามารถวิเคราะห์ข้อมูลได้แบบ Real-time ที่ตำแหน่งที่ตั้งจริง (Edge Inference) ลด Latency จากหลายร้อยมิลลิวินาที (ส่งขึ้น Cloud แล้วรอผล) เหลือเพียง 1-10 มิลลิวินาที ซึ่งเป็นความแตกต่างที่สำคัญต่อการตัดสินใจเชิงควบคุม
สถาปัตยกรรม TinyML สำหรับ Industrial IoT
ระบบ TinyML แบ่งเป็น 3 ชั้นหลัก:
- ชั้นฝึกอบรม (Training Phase): ฝึกโมเดลบน Cloud หรือเวิร์กสเตชันด้วย Dataset ขนาดใหญ่ ใช้เทคนิค Quantization และ Pruning ลดขนาดโมเดลให้พอดีกับ MCU
- ชั้นแปลงโมเดล (Model Optimization): ใช้ ML Framework สำหรับ Microcontrollers (เช่น TFLM, MCUNet) แปลงโมเดลจาก float32 เป็น int8 ลดขนาดลง 4 เท่าโดย Accuracy ลดลงไม่เกิน 2-3%
- ชั้นอนุมาน (Inference on Device): รันโมเดลบน MCU โดยตรง ตัวอย่างเช่น MCU ระดับ Cortex-M7 ที่มี RAM 1MB สามารถรัน CNN สำหรับ Anomaly Detection ที่ 50 MHz ได้โดยใช้พลังงานเพียง 150 mW
ตารางเปรียบเทียบ MCU ยอดนิยมสำหรับ TinyML ในอุตสาหกรรม
| Microcontroller | RAM | Flash | Clock Speed | Use Case ที่เหมาะสม |
|---|---|---|---|---|
| ARM Cortex-M4 Class | 256 KB | 1 MB | 80-120 MHz | Vibration Analysis, Audio Classification |
| ARM Cortex-M7 Class | 1 MB | 2 MB | 400-480 MHz | Visual Inspection, Predictive Maintenance |
| ESP32 Series | 520 KB | 4-16 MB | 240 MHz | WiFi/BLE IoT Gateway, Voice Command |
| RISC-V MCU | 128-512 KB | 1-4 MB | 100-320 MHz | Low-power Sensor Node, Anomaly Detection |
Use Case ในโรงงานอุตสาหกรรม
1. Predictive Maintenance ด้วย Vibration Analysis
ติดตั้ง Accelerometer MEMS บน Motor Bearing แล้วใช้ TinyML วิเคราะห์รูปคลื่นสั่นสะเทือน (Vibration Signal) ได้โดยตรงที่ Sensor Node โมเดล 1D-CNN ขนาดเพียง 80 KB สามารถจำแนกสภาพ Bearing ได้ 4 ระดับ: Normal, Warning, Critical, Failure ด้วย Accuracy สูงถึง 96.5% โดยไม่ต้องส่งข้อมูล Raw Data ขึ้น Cloud
2. Audio Anomaly Detection บน Production Line
ใช้ Microphone MEMS + MCU ระดับ Cortex-M4 รัน Audio Classification Model ขนาด 45 KB ตรวจจับเสียงผิดปกติบนสายการผลิบ เช่น เสียง Bearing กระทบ เสียง Valve รั่ว หรือเสียง Motor ไม่สมดุล ระบบสามารถแจ้งเตือนได้ภายใน 50 ms หลังตรวจพบความผิดปกติ
3. Visual Quality Inspection ด้วย Low-power Camera
ใช้ MCU ระดับ Cortex-M7 ต่อกับ Camera Module ความละเอียด QVGA (320×240) รัน CNN แบบ Quantized ขนาด 200 KB ตรวจสอบ Defect บนชิ้นงาน เช่น รอยร้าว สีผิด หรือ Component หาย โดยอัตราการประมวลผลอยู่ที่ 5-15 FPS ซึ่งเพียงพอสำหรับ Production Line ที่มีความเร็วปานกลาง
เทคนิค Optimization สำคัญ
- Post-Training Quantization: แปลง Weight จาก float32 → int8 ลดขนาดโมเดล 4x และเร่งความเร็ว 2-3x บน MCU ที่รองรับ DSP Instruction
- Pruning: ตัด Weight ที่มีค่าต่ำออก ลดจำนวน Parameter 30-70% โดย Accuracy แทบไม่เปลี่ยน
- Knowledge Distillation: ใช้โมเดลใหญ่ (Teacher) สอนโมเดลเล็ก (Student) ให้เรียนรู้รูปแบบเดียวกัน แต่ต้องการ Parameter น้อยกว่า
- Neural Architecture Search (NAS): ค้นหาโครงสร้าง Network ที่เหมาะสมที่สุดสำหรับ Hardware เฉพาะเจาะจง
ข้อดีของ TinyML เทียบกับ Cloud AI ในโรงงาน
| เกณฑ์ | TinyML (On-Device) | Cloud AI |
|---|---|---|
| Latency | 1-10 ms | 100-500 ms |
| Internet Dependency | ไม่ต้องการ | จำเป็น |
| Power Consumption | 10-500 mW | N/A (ฝั่ง Server) |
| Data Privacy | สูง (ข้อมูลไม่ออกจากอุปกรณ์) | ต่ำกว่า (ส่งข้อมูลขึ้น Cloud) |
| Cost/Node | ต่ำมาก (MCU ระดับ Low-cost) | ต้องมี Cloud Subscription |
| Model Complexity | จำกัด (โมเดลเล็ก) | ไม่จำกัด |
Key Takeaways — สิ่งที่วิศวกรต้องรู้
- TinyML ทำให้ MCU ราคาประหยัด (ไม่กี่ดอลลาร์) สามารถรัน Machine Learning Inference ได้โดยไม่ต้องเชื่อม Cloud
- เทคนิค Quantization (int8), Pruning และ Knowledge Distillation เป็นหัวใจสำคัญในการลดขนาดโมเดลให้พอดีกับ MCU
- Use Case ที่เหมาะสมที่สุดคือ Anomaly Detection, Vibration Analysis และ Audio Classification บน Production Line
- Latency ต่ำถึง 1-10 ms ทำให้เหมาะสำหรับ Application ที่ต้องการ Real-time Decision เช่น Emergency Shutdown
- TinyML เสริม — ไม่ได้ทดแทน — Cloud AI โดยทำหน้าที่เป็น “Filter” ส่งเฉพาะข้อมูลที่ผิดปกติขึ้น Cloud เพื่อวิเคราะห์เชิงลึกต่อ
💡 ข้อควรพิจารณา: TinyML ไม่ได้เหมาะกับทุก Use Case หากต้องการโมเดลที่ซับซ้อน เช่น Object Detection แบบหลาย Class หรือ NLP ขั้นสูง ควรใช้ Edge AI บน Embedded GPU หรือส่งขึ้น Cloud แทน TinyML เหมาะที่สุดกับ Classification และ Anomaly Detection บนข้อมูล 1D (Time-Series, Audio) หรือรูปภาพความละเอียดต่ำ
