Improving Road Safety: A comparison of Object Detection Models for Road Monitoring Systems
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesis
Abstract [en]
The proliferation of Deep Learning Object Detection Models (DLODM) has significantly advanced the capabilities of real-time object recognition, particularly in road monitoring systems within Smart Cities. These systems capable of extracting accurate information from images and videos in a timely fashion could play an essential role in enhancing road safety. This thesis embarks on a critical evaluation of three advanced Deep Learning Object Detection Models—YOLOv8, YOLOv4, and EfficientDet-D1, focusing on their efficacy in detecting road users in real-world traffic scenarios. The comparison focuses on two key metrics, accuracy and inference time, with the hypothesis that the newer YOLOv8 model, will outperform the other two models in both aspects. To address this challenge the implementation and testing of each model against a specially curated dataset, derived from actual CCTV footage, was conducted, showing results that confirm the hypothesis. When put in front of realworld traffic data, YOLOv8 outperforms the other two models in all the categories and in all the object sizes. Moreover, the study outcomes show how this more recent model is able to make faster detection when put in front of the same real-world scenarios. YOLOv4 offered a balanced alternative with reasonable accuracy and a high inference rate, while EfficientDet-D1, despite high accuracy, lagged in inference speed.
Abstract [sv]
Den ökade användningen av djupinlärningsmodeller för objektdetektering (DLODM) har avsevärt förbättrat förmågan att känna igen objekt i realtid, särskilt i vägövervakningssystem inom smarta städer. Dessa system, som kan extrahera korrekt information från bilder och videor på ett snabbt sätt, kan spela en avgörande roll för att förbättra trafiksäkerheten. Denna avhandling genomför en kritisk utvärdering av tre avancerade djupinlärningsmodeller för objektdetektering - YOLOv8, YOLOv4 och EfficientDet - med fokus på deras effektivitet för att detektera trafikanter i verkliga trafikscenarier. Jämförelsen fokuserar på två nyckelmått, noggrannhet och inferenstid, med hypotesen att den nyare modellen YOLOv8 kommer att överträffa de andra två modellerna i båda aspekterna. För att ta itu med denna utmaning genomfördes implementering och testning av varje modell mot ett speciellt kuraterat dataset, hämtat från faktisk CCTV-filmning, vilket visade resultat som bekräftar hypotesen. När de ställdes inför verkliga trafikdata överträffade YOLOv8 de andra två modellerna i alla kategorier och i alla objektstorlekar. Dessutom visar studiens resultat hur denna nyare modell kan göra snabbare detektering när den ställs inför samma verkliga scenarier. YOLOv4 erbjöd ett balanserat alternativ med rimlig noggrannhet och hög inferenshastighet, medan EfficientDet-D1, trots hög noggrannhet, hade långsammare inferenstid.
Place, publisher, year, edition, pages
2024. , p. 67
Series
TRITA-EECS-EX ; 2024:31
Keywords [en]
Deep Learning, Object Detection, Road Monitoring Systems, Road Safety, Smart Cities
Keywords [sv]
Djupinlärning, Objektdetektering, Vägövervakningssystem, Trafiksäkerhet, Smarta städer
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-345838OAI: oai:DiVA.org:kth-345838DiVA, id: diva2:1853294
External cooperation
Scania AB
Supervisors
Examiners
2024-05-072024-04-222025-01-17Bibliographically approved