Speaker
Description
Durante los últimos años las personas han demostrado tener una mayor preocupación sobre su dieta alimentaria, ya sea para prevenir enfermedades, para tratamientos médicos u otros. En comidas servidas en restaurantes, colegios o comedores públicos no es fácil identificar los ingredientes y/o información nutricional contenida en estas. Actualmente existen soluciones tecnológicas basadas en modelos de aprendizaje profundo que facilitan el registro y seguimiento de los alimentos consumidos a partir de una imagen. Teniendo en cuenta de que en ocasiones es posible que existan múltiples ítems de comidas servidas en un mismo plato, el análisis de los alimentos debe ser tratado como un problema de detección de objetos y no de clasificación. EfficientDet y YOLOv5 son algoritmos de detección de objetos que han demostrado una alta precisión y funcionamiento en tiempo real sobre datos de dominio general. Sin embargo, estos modelos no han sido evaluados y comparados sobre bases de datos públicas de alimentos. A diferencia de los objetos de dominio general, los alimentos poseen características más desafiantes propias de su naturaleza que elevan la complejidad de la detección. En este artículo, se realiza una comparativa del desempeño de EfficientDet y YOLOv5 sobre UNIMIB2016 y UECFood256. De los resultados obtenidos, podemos observar que YOLOv5 provee una diferencia significativa tanto en términos de precisión como de tiempo de respuesta en comparación con EfficientDet. Además, YOLOv5 obtiene un rendimiento superior al evidenciado en el estado-del-arte sobre UECFood256, logrando una mejora de más de un 4,95% en términos de mAP@0.5.