A Step Towards a Multi-Stage, Visual-Based Dietary Assessment Smartphone Application: A Computational Approach to Food Volume Estimation Using Smartphone-Based Augmented Reality
2025 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Ett steg mot en visuellt-baserad, flerstegs-kostbedömningsapplikation för Smartphones : En beräkningsmetod för uppskattning av matvolym med hjälp av smartphonebaserad augmented reality (Swedish)
Abstract [en]
According to the World Health Organisation, the worldwide prevalence of obesity in adults has increased by 72% between the years 1990 and 2022, largely due to unhealthy eating habits. Dietary Assessment (DA) can be an effective way to improve eating habits, leading to a reduction in obesity, human suffering and healthcare costs. Visual-Based Dietary Assessment (VBDA) is a promising alternative which attempts to automate some of the more labour-intensive steps of DA. The primary objective of this study was the development of an accessible proof of concept method for accurate (20% Mean Absolute Percentage Error) smartphone-visual based food amount estimations. To this end, the study was two-fold: the development of an Android application to act as a measurement device and the development of a data processing pipeline in Python. The Android application incorporated Google’s ARCore augmented reality software library to generate a point cloud representation of a scene containing reference objects. The point clouds were processed in Python to identify points associated with the reference objects, after which a Convex Hull algorithm was applied to fit a closed surface around said points and estimate object volume. Two types of parameter optimisation were applied to improve accuracy in both the specific and the general case. Out of 40 measurements, 28 were excluded due to exhibiting a malformed cloud point representation of the reference objects in the scene. This left 12 measurements for evaluation. Using per-measurement parameter optimisation, the method achieved an absolute error between 0.2 – 34.5 ml (0.0 – 16.1%) with a mean absolute error of 7.9ml (3.7%) and bias of -4.4ml (-2.0%). Using one-size-fits-all parameter optimisation, the method achieved an absolute error between 9.3 – 210.9 ml (4.3 – 98.5%) with a mean absolute error of 117ml (54.7%) and bias of -85.5ml (-40.0%). As such, the method was unable to achieve the target accuracy in the general, one-size-fits-all case. As a proof of concept, the method shows some promise. However, a lack of consistent point cloud representation hampers real-life applications. Future studies may improve upon the existing codebase to stabilise point cloud generation or consider the development of a non-deterministic processing pipelineto reduce the impact of malformed point clouds.
Abstract [sv]
Enligt Världshälsoorganisationen har den globala prevalensen av fetma hos vuxna ökat med 72% mellan åren 1990 och 2022, huvudsakligen på grund av ohälsosamma matvanor. Kostbedömning (DA) kan vara ett effektivt sätt att förbättra matvanor, vilket leder till en minskning av fetma, mänskligt lidande och vårdkostnader. Visuellt baserad kostbedömning (VBDA) är ett lovande alternativ som försöker automatisera vissa av de mer arbetsintensiva stegen i DA. Huvudsyftet med denna studie var att utveckla en lättillgänglig “proof of concept”-metod för noggranna (Mean Absolute Percentage Error ≤ 20%) smartphone-baserade uppskattningar av matmängd. För detta syfte var studien två-delad; utvecklingen av en Android-applikation som mätinstrument och utvecklingen av en datapipeline för bearbetning i Python. Android-applikationen integrerade Googles ARCore Augmented Reality-programvarubibliotek för att generera punktmolnsrepresentationer av en scen som innehöll referensobjekt. Punktmolnen bearbetades i Python för att identifiera punkter associerade med referensobjekten, varefter en Convex Hull-algoritm tillämpades för att anpassa en sluten yta runt dessa punkter och uppskatta objektvolymen. Två typer av parameteroptimering användes för att förbättra noggrannheten i både det specifika och det generella fallet. Av 40 mätningar uteslöts 28 på grund av att de uppvisade felaktig punktmolnsrepresentation av referensobjekten i scenen. Detta lämnade 12 mätningar för utvärdering. Genom att använda “per-measurement” parameteroptimering uppnåddes ett absolut fel mellan 0,2 – 34,5 ml (0,0 – 16,1%) med ett medelabsolutfel på 7,9 ml (3,7%) och ett bias på -4,4 ml (-2,0%). Genom att använda en “one-size-fits-all” parameteroptimering uppnåddes ett absolut fel mellan 9,3 – 210,9 ml (4,3 – 98,5%) med ett medelabsolutfel på 117 ml (54,7%) och ett bias på -85,5 ml (-40,0%). Metoden lyckades således inte uppnå den önskade noggrannheten i det generella fallet. Som ett “proof of concept” visar metoden vissa lovande tecken. Dock hindrar bristen på konsekventa punktmolnsrepresentationer användning i verkliga applikationer. Framtida studier kan förbättra den befintliga kodbasen för att stabilisera punktmolngenereringen eller överväga utveckling av en icke-deterministisk bearbetningspipeline för att minska effekten av felaktiga punktmoln.
Place, publisher, year, edition, pages
2025. , p. 78
Series
TRITA-CBH-GRU ; 2025:013TRITA-CBH-GRU
Keywords [en]
Volume Estimation, Dietary Assessment, Augmented Reality, ARCore, Smartphone
Keywords [sv]
Volymestimering, Kostanalys, Augmented Reality, ARCore, Smartphone
National Category
Medical Engineering Food Science Software Engineering
Identifiers
URN: urn:nbn:se:kth:diva-368645OAI: oai:DiVA.org:kth-368645DiVA, id: diva2:1990246
Subject / course
Medical Engineering
Educational program
Master of Science - Medical Engineering
Supervisors
Examiners
2025-09-152025-08-192025-09-15Bibliographically approved