kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Evaluation of Point Cloud Semantic Segmentation Methods
KTH, School of Architecture and the Built Environment (ABE), Real Estate and Construction Management.
2025 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Utvärdering av metoder för semantisk segmentering av punktmoln (Swedish)
Abstract [en]

More and more countries worldwide face a building shortage and are in high demand for affordable housing. The consensus has long been that there needs to be more material on earth to keep building new buildings; instead, the materials already in use must be taken care of. However, the question remains: what are the most effective strategies for ensuring the sustainable care and maintenance of existing buildings? There is no easy answer to this question. Nevertheless, what is for sure is that more information is always needed. That is where Building Information Modelling (BIM) comes in. BIM is a 3D representation of a building, ranging from a crude representation of the object to being a detailed digital twin with every detail thinkable documented.

Scanning a building with LiDAR allows centimetre precision without measuring every nook and cranny with a measuring tape, potentially bringing down the groundwork to hours instead of days. However, it is not only the scanning that takes time but also the postprocessing, such as identifying and converting the point cloud, used for a 3D model. In converting the point cloud, one task is identifying objects that will be part of the 3D model. The objects identified could be whatever is deemed necessary for the specific building. For example, stairs would be essential for one building rather than for others.

This thesis investigated the performance of different methods evaluating accuracy, ease of use, and general classification on regular BIM objects such as walls, floors, ceilings, and doors. This test and evaluation of classification methods aims to determine whether machine learning for object recognition can be a practical alternative to manually creating objects.By implementing three different methods called Pointnet++, RandLa-Net and KPConv both with coding and with software an overview of the different methods and approches is gained.Overall the best results for implementing these methods were achieved by the software method using KPConv. The software method was both easier to use and produced better overall result for all objects. Pointnet++ and RandLa-Net both performed weakly compared to earlier studies and required significant parameter tuning and testing to improve the result.In conclusion, while manual coding methods have their place in research and development, the study strongly supports the integration of sophisticated algorithms like KPConv into commercial software solutions for routine BIM tasks. This approach enhances workflow efficiency and accuracy and makes advanced semantic segmentation techniques more accessible to a broader range of practitioners. Future research should focus on optimising manual methods, expanding dataset diversity, and validating these techniques in real-world BIM projects to advance the field.

Abstract [sv]

Fler och fler länder världen över står inför en brist på byggnader och en hög efterfrågan på prisvärda bostäder. Den rådande uppfattningen har länge varit att det inte finns tillräckligt med material på jorden för att fortsätta bygga nya byggnader; istället måste de material som redan är i bruk tas om hand. Frågan kvarstår dock: vilka är de mest effektiva strategierna för att säkerställa hållbar förvaltning och underhåll av befintliga byggnader? Det finns inget enkelt svar på denna fråga. Det som däremot är säkert är att mer information alltid behövs – och här kommer Building Information Modelling (BIM) in i bilden. BIM är en 3D-representation av en byggnad som kan variera från en enkel modell till en detaljerad digital tvilling där varje tänkbar detalj är dokumenterad. Att skanna en byggnad med LiDAR möjliggör precision på centimeternivå utan att behöva mäta varje vrå manuellt med måttband, vilket potentiellt kan reducera det inledande arbetet från dagar till timmar. Det är dock inte enbart själva skanningen som tar tid, utan även efterbearbetningen, såsom identifiering och konvertering av punktmolnet till en användbar 3D-modell. Vid konverteringen av punktmolnet är en av de viktigaste uppgifterna att identifiera de objekt som ska ingå i 3D-modellen. Vilka objekt som identifieras beror på byggnadens specifika behov – exempelvis kan trappor vara avgörande i vissa byggnader men mindre viktiga i andra. Denna avhandling undersökte prestandan hos olika metoder genom att utvärdera noggrannhet, användarvänlighet och klassificering av vanliga BIM-objekt såsom väggar, golv, tak och dörrar. Syftet med testet och utvärderingen av klassificeringsmetoderna är att avgöra huruvida maskininlärning för objektigenkänning kan vara ett praktiskt alternativ till manuell modellering av objekt. Genom att implementera tre olika metoder – PointNet++, RandLa-Net och KPConv – både genom programmering och med programvara, ges en översikt över de olika metoderna och tillvägagångssätten. Överlag uppnåddes de bästa resultaten genom att använda programvaran med KPConv, som visade sig vara både enklare att använda och ge bättre resultat för samtliga objekt. PointNet++ och RandLa-Net presterade svagare jämfört med tidigare studier och krävde omfattande parameterinställningar och tester för att förbättra resultaten. Sammanfattningsvis, även om manuella kodningsmetoder har sin plats inom forskning och utveckling, visar denna studie tydligt på fördelarna med att integrera avancerade algoritmer såsom KPConv i kommersiella programvarulösningar för rutinmässiga BIM-uppgifter. Denna strategi förbättrar både arbetsflödets effektivitet och noggrannhet samt gör avancerade semantiska segmenteringsmetoder mer tillgängliga för en bredare grupp av användare. Framtida forskning bör fokusera på att optimera manuella metoder, bredda datasetets mångfald och validera dessa tekniker i verkliga BIM-projekt för att driva området framåt.

Place, publisher, year, edition, pages
2025. , p. 54
Series
TRITA-ABE-MBT ; 2549
Keywords [en]
Semantic Segmentation, BIM, Convolution Neural Network, LiDAR
Keywords [sv]
Semantisk Segmentering, BIM, Konvolutionellt Neuralt Nätverk, LiDAR
National Category
Civil Engineering
Identifiers
URN: urn:nbn:se:kth:diva-360854OAI: oai:DiVA.org:kth-360854DiVA, id: diva2:1942195
Supervisors
Examiners
Available from: 2025-03-04 Created: 2025-03-04 Last updated: 2025-03-04Bibliographically approved

Open Access in DiVA

fulltext(4305 kB)103 downloads
File information
File name FULLTEXT01.pdfFile size 4305 kBChecksum SHA-512
a1a25715bc75a326b44c098dcaa26e29cf7f144da071ee6cbd5fc8b570c3df54fa37cdc820a484d5a863416ca74047b6d070041b3673714050ba38a745e32ec1
Type fulltextMimetype application/pdf

By organisation
Real Estate and Construction Management
Civil Engineering

Search outside of DiVA

GoogleGoogle Scholar
Total: 103 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 624 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf