kth.sePublications KTH
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
A Step Towards a Multi-Stage, Visual-Based Dietary Assessment Smartphone Application: A Computational Approach to Food Volume Estimation Using Smartphone-Based Augmented Reality
KTH, School of Engineering Sciences in Chemistry, Biotechnology and Health (CBH), Biomedical Engineering and Health Systems.
2025 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Ett steg mot en visuellt-baserad, flerstegs-kostbedömningsapplikation för Smartphones : En beräkningsmetod för uppskattning av matvolym med hjälp av smartphonebaserad augmented reality (Swedish)
Abstract [en]

According to the World Health Organisation, the worldwide prevalence of obesity in adults has increased by 72% between the years 1990 and 2022, largely due to unhealthy eating habits. Dietary Assessment (DA) can be an effective way to improve eating habits, leading to a reduction in obesity, human suffering and healthcare costs. Visual-Based Dietary Assessment (VBDA) is a promising alternative which attempts to automate some of the more labour-intensive steps of DA. The primary objective of this study was the development of an accessible proof of concept method for accurate (20% Mean Absolute Percentage Error) smartphone-visual based food amount estimations. To this end, the study was two-fold: the development of an Android application to act as a measurement device and the development of a data processing pipeline in Python. The Android application incorporated Google’s ARCore augmented reality software library to generate a point cloud representation of a scene containing reference objects. The point clouds were processed in Python to identify points associated with the reference objects, after which a Convex Hull algorithm was applied to fit a closed surface around said points and estimate object volume. Two types of parameter optimisation were applied to improve accuracy in both the specific and the general case. Out of 40 measurements, 28 were excluded due to exhibiting a malformed cloud point representation of the reference objects in the scene. This left 12 measurements for evaluation. Using per-measurement parameter optimisation, the method achieved an absolute error between 0.2 – 34.5 ml (0.0 – 16.1%) with a mean absolute error of 7.9ml (3.7%) and bias of -4.4ml (-2.0%). Using one-size-fits-all parameter optimisation, the method achieved an absolute error between 9.3 – 210.9 ml (4.3 – 98.5%) with a mean absolute error of 117ml (54.7%) and bias of -85.5ml (-40.0%). As such, the method was unable to achieve the target accuracy in the general, one-size-fits-all case. As a proof of concept, the method shows some promise. However, a lack of consistent point cloud representation hampers real-life applications. Future studies may improve upon the existing codebase to stabilise point cloud generation or consider the development of a non-deterministic processing pipelineto reduce the impact of malformed point clouds.

Abstract [sv]

Enligt Världshälsoorganisationen har den globala prevalensen av fetma hos vuxna ökat med 72% mellan åren 1990 och 2022, huvudsakligen på grund av ohälsosamma matvanor. Kostbedömning (DA) kan vara ett effektivt sätt att förbättra matvanor, vilket leder till en minskning av fetma, mänskligt lidande och vårdkostnader. Visuellt baserad kostbedömning (VBDA) är ett lovande alternativ som försöker automatisera vissa av de mer arbetsintensiva stegen i DA. Huvudsyftet med denna studie var att utveckla en lättillgänglig “proof of concept”-metod för noggranna (Mean Absolute Percentage Error ≤ 20%) smartphone-baserade uppskattningar av matmängd. För detta syfte var studien två-delad; utvecklingen av en Android-applikation som mätinstrument och utvecklingen av en datapipeline för bearbetning i Python. Android-applikationen integrerade Googles ARCore Augmented Reality-programvarubibliotek för att generera punktmolnsrepresentationer av en scen som innehöll referensobjekt. Punktmolnen bearbetades i Python för att identifiera punkter associerade med referensobjekten, varefter en Convex Hull-algoritm tillämpades för att anpassa en sluten yta runt dessa punkter och uppskatta objektvolymen. Två typer av parameteroptimering användes för att förbättra noggrannheten i både det specifika och det generella fallet. Av 40 mätningar uteslöts 28 på grund av att de uppvisade felaktig punktmolnsrepresentation av referensobjekten i scenen. Detta lämnade 12 mätningar för utvärdering. Genom att använda “per-measurement” parameteroptimering uppnåddes ett absolut fel mellan 0,2 – 34,5 ml (0,0 – 16,1%) med ett medelabsolutfel på 7,9 ml (3,7%) och ett bias på -4,4 ml (-2,0%). Genom att använda en “one-size-fits-all” parameteroptimering uppnåddes ett absolut fel mellan 9,3 – 210,9 ml (4,3 – 98,5%) med ett medelabsolutfel på 117 ml (54,7%) och ett bias på -85,5 ml (-40,0%). Metoden lyckades således inte uppnå den önskade noggrannheten i det generella fallet. Som ett “proof of concept” visar metoden vissa lovande tecken. Dock hindrar bristen på konsekventa punktmolnsrepresentationer användning i verkliga applikationer. Framtida studier kan förbättra den befintliga kodbasen för att stabilisera punktmolngenereringen eller överväga utveckling av en icke-deterministisk bearbetningspipeline för att minska effekten av felaktiga punktmoln.

Place, publisher, year, edition, pages
2025. , p. 78
Series
TRITA-CBH-GRU ; 2025:013TRITA-CBH-GRU
Keywords [en]
Volume Estimation, Dietary Assessment, Augmented Reality, ARCore, Smartphone
Keywords [sv]
Volymestimering, Kostanalys, Augmented Reality, ARCore, Smartphone
National Category
Medical Engineering Food Science Software Engineering
Identifiers
URN: urn:nbn:se:kth:diva-368645OAI: oai:DiVA.org:kth-368645DiVA, id: diva2:1990246
Subject / course
Medical Engineering
Educational program
Master of Science - Medical Engineering
Supervisors
Examiners
Available from: 2025-09-15 Created: 2025-08-19 Last updated: 2025-09-15Bibliographically approved

Open Access in DiVA

fulltext(76553 kB)55 downloads
File information
File name FULLTEXT01.pdfFile size 76553 kBChecksum SHA-512
5f35a90151c38bab62c9c66efaa529579accfa8be792c342df2090846728b049fb459e04002e4a8183786b6e772a19210a00c165c8d2c94cbc70c9625dfdde44
Type fulltextMimetype application/pdf
software(536394 kB)0 downloads
File information
File name SOFTWARE01.zipFile size 536394 kBChecksum SHA-512
138acd6acb94961bd518836638802a1b79650e7085231db55e35ebc01142dd1e1b240edcbe99afd8c12cafadec0369e9d1e71a188fa98dbda619b2a3181c77a3
Type softwareMimetype application/zip

By organisation
Biomedical Engineering and Health Systems
Medical EngineeringFood ScienceSoftware Engineering

Search outside of DiVA

GoogleGoogle Scholar
Total: 55 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 333 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf