สร้าง AI ตรวจจับวัตถุในรูปภาพด้วย Roboflow
Object Detection : Roboflow
ในยุคที่เทคโนโลยีปัญญาประดิษฐ์ก้าวข้ามขอบเขตของการสื่อสารและการรับรู้ของเราอย่างรวดเร็ว การใช้ปัญญาประดิษฐ์ในการตรวจจับและคัดแยกรูปภาพเป็นเรื่องสำคัญที่ช่วยให้บริษัทหรือองค์กรต่างๆ สามารถปรับปรุงกระบวนการทำงานและการบริการได้อย่างมีประสิทธิภาพมากขึ้น ในบทความนี้เราจะใช้ Roboflow เพื่อการตรวจจับป้ายโฆษณาและการคัดแยกรูปภาพในโปรเจกต์
Are you ready?
Roboflow เป็นเครื่องมือที่ใช้ในการพัฒนาและฝึกโมเดล Computer Vision โดยให้ความสำคัญกับการสร้างชุดข้อมูลภาพเพื่อใช้ในการฝึกโมเดล ในกรณีนี้เรานำจะรูปภาพป้ายโฆษณาที่มีอยู่ในคลังข้อมูลมาใช้เป็นชุดข้อมูลสำหรับการฝึกโมเดล
Let’s get started !
Step 1 : ขั้นตอนแรกไปที่ https://roboflow.com/ เพื่อสร้างโปรเจกต์
Step 2 : จากนั้นอัปโหลดรูปภาพป้ายโฆษณาที่มีอยู่ในคลังข้อมูลของเรามาใช้เป็นชุดข้อมูล สำหรับการฝึกโมเดล
Step 3 : ทำการ annotate ในการสร้างกรอบสี่เหลี่ยม (bounding box) รอบป้ายโฆษณาในแต่ละรูปภาพ
Step 4 : เมื่อเสร็จสิ้นการ annotate ก็เช็ค class balance ที่ dataset health check เพื่อดูว่าข้อมูลการกระจายของข้อมูลในแต่ละคลาสของชุดข้อมูลมีข้อมูลที่สมดุลกันหรือไม่ ถ้าสมดุลจะถือว่าเป็น class balance
ถ้า class ไหนที่มีข้อมูลน้อยเกินไปจะเกิดการ under represented แต่ถ้า class ไหนมีข้อมูลมากเกินก็ over represented ได้ เพราะฉะนั้นควรปรับข้อมูลให้เป็น class balance อยู่เสมอ
Step 5 : Augmentation (การเพิ่มข้อมูล) เป็นการปรับแต่งข้อมูลที่ใช้ในการสร้างข้อมูลเพิ่มเติมโดยใช้วิธีการแปลงแบบสัมพันธ์จากข้อมูลต้นฉบับ เพื่อสร้างความหลากหลายในชุดข้อมูล
Step 6 : Training Machine Learning
ค่าทั้งสามคือค่าที่แสดงถึงประสิทธิภาพของระบบการคัดแยกรูปภาพป้ายโฆษณา โดยมีค่าสูงสุดของ mAP ที่ 99.5% และมีค่าความแม่นยำสูงสุดของ Precision ที่ 98.5% และค่าความแม่นยำสูงสุดของ Recall ที่ 99.3%
Step 7 : ทดสอบรูปภาพและความแม่นยำของโมเดล
{
"predictions": [
{
"x": 2733.5,
"y": 879.5,
"width": 997,
"height": 591,
"confidence": 0.934,
"class": "Sprite"
}
]
}
ข้อดีของ Roboflow :
- เป็นเครื่องมือที่ใช้งานง่ายและมีอินเทอร์เฟซที่ใช้งานได้สะดวก ซึ่งช่วยให้ผู้ใช้สามารถสร้างและจัดการชุดข้อมูลสำหรับการฝึกโมเดล Computer Vision ได้อย่างรวดเร็วและมีประสิทธิภาพ
- รองรับรูปแบบไฟล์หลากหลาย เช่น YOLO, COCO, PASCAL VOC, TensorFlow Object Detection API เป็นต้น ทำให้สามารถนำข้อมูลและโมเดลมาใช้งานร่วมกันได้อย่างยืดหยุ่น
- ความแม่นยำในการตรวจจับ Roboflow ช่วยให้เราสามารถฝึกและปรับปรุงโมเดลให้มีความแม่นยำสูงในการตรวจจับวัตถุ ทำให้สามารถคัดแยกและตรวจจับป้ายโฆษณาได้อย่างมีประสิทธิภาพ
ข้อเสียของ Roboflow :
- ข้อจำกัดในการปรับแต่งรายละเอียดในการสร้างโมเดล อาจจำเป็นต้องใช้เครื่องมือหรือภาษาโปรแกรมอื่นเพื่อให้ได้การปรับแต่งที่ตรงตามความต้องการ
- การจำกัดในการประมวลผลภาพมีความซับซ้อนและใช้เวลานาน ซึ่งอาจใช้เวลาในการสร้างชุดข้อมูลและฝึกโมเดลที่ใช้เวลานานเมื่อมีข้อมูลมาก
Just do it
ไม่ยากเลยใช่ไหมครับ กับการสร้าง AI หรือโปรแกรมทำนายรูป ง่ายๆ เพียงแค่ไม่กี่ขั้นตอนเท่านั้นเอง ไว้โอกาสหน้าผมจะประยุกต์ใช้ AI ในการทำนายรูปภาพที่อยู่ใน folders และกระจายไปตาม folders ที่ถูกทำนายโดยอัตโนมัติ