Data analysis and data reduction for large-scale turbulence simulations
2025 (Engelska)Doktorsavhandling, sammanläggning (Övrigt vetenskapligt)
Abstract [en]
Computational fluid dynamics (CFD) and direct numerical simulations (DNS),when applied to the study of turbulence, have traditionally been treated as acompute bound discipline, where the size of problems of interest is limited bythe capacity of supercomputers. While this remains true, the relatively recentadoption of specialized hardware such as graphics processing units (GPUs) hasallowed researchers to start studying problems that were not thought possiblebefore. This trend brings benefits for scientific discovery, however, it alsoaccentuates the importance of robust methodologies to manage and processthe increasing amount of data that is being produced by the simulations. Thepresent thesis explores techniques to process large scale data sets produced,mainly, by the spectral element method (SEM).This study explores the possibility to exploit the computational resourcesused by the simulations to perform data analysis and transformations in whatis termed, in-situ data processing. It is shown that it is viable to apply amultitude of processing tasks, such as data compression and image visualizationefficiently, as long as the hardware being used is taken into consideration, whichis relevant for modern heterogeneous systems. Furthermore it is shown that datacompression is an efficient technique to reduce storage requirements while keepingaccuracy, even for turbulence research. On this note, this thesis introduces amethod that incorporates uncertainty quantification (UQ) techniques for datacompression to facilitate the data quality evaluation.Data compression is a large focus in the present work, however, methodsto facilitate data analysis are also studied. Streaming and parallel modaldecompositions, in particular proper orthogonal decomposition (POD), aredeveloped and made available to the turbulence community with the additionof uncertainty quantification studies to ease its adoption. It is found thatthis sort of technique is excellent at increasing the interpretability of the data,while being able to exploit computational resources with in-situ execution.Additionally, parallel high-order interpolation techniques are introduced, whichbecome essential to reduce the memory footprint of large data sets whenperforming post-processing tasks, while aiding to simplify the data distributionof traditional SEM meshes.
Abstract [sv]
Beräkningsvätskedynamik (CFD) och direkta numeriska simuleringar (DNS)har, när de tillämpas på studien av turbulens, traditionellt behandlats som enberäkningsbegränsad disciplin där storleken på intressanta problem begränsas avsuperdatorers kapacitet. Även om detta fortfarande stämmer har den relativt nyaanvändningen av specialiserad hårdvara, såsom grafikprocessorer (GPU:er), gjortdet möjligt för forskare att börja studera problem som tidigare betraktades somoåtkomliga. Denna utveckling gynnar den vetenskapliga kunskapsutvecklingen,men den betonar också behovet av robusta metoder för att hantera och bear-beta den växande datamängd som genereras av simuleringarna. Föreliggandeavhandling undersöker tekniker för att bearbeta storskaliga datamängder somhuvudsakligen produceras med spektralelementmetoden (SEM).Denna studie utforskar möjligheten att utnyttja de beräkningsresurser somanvänds av simuleringarna för att utföra dataanalys och transformationer inomså kallad in situ-databehandling. Den belyser att det är möjligt att effektivtgenomföra en rad bearbetningsuppgifter, såsom datakomprimering och visualise-ring, under förutsättning att den använda hårdvaran beaktas, vilket är särskiltrelevant för moderna heterogena system. Vidare åskådliggörs att datakomprime-ring är en effektiv metod för att minska lagringsbehovet samtidigt som noggrann-heten bibehåll, även inom turbulensforskning. I detta sammanhang introduceraravhandlingen en metod som integrerar tekniker för osäkerhetskvantifiering (UQ)i datakomprimering för att underlätta bedömningen av datakvalitet.Datakomprimering är ett centralt fokus i arbetet, men även metodersom underlättar dataanalys studeras. Strömmande och parallella modalned-brytningar, i synnerhet Proper Orthogonal Decomposition (POD), utveck-las och görs tillgängliga för turbulensfältet, kompletterade med studier avosäkerhetskvantifiering för att underlätta införandet. Det konstateras att dennatyp av teknik i hög grad ökar datans tolkbarhet samtidigt som den kan utnyttjaberäkningsresurser genom in situ. Dessutom introduceras parallella interpola-tionsmetoder av hög ordning, vilka är avgörande för att minska minnesavtryckethos stora datamängder vid efterbehandling och som samtidigt bidrar till attförenkla datadistributionen i traditionella SEM-nät.
Ort, förlag, år, upplaga, sidor
Stockholm, Sweden: KTH Royal Institute of Technology, 2025. , s. 56
Serie
TRITA-SCI-FOU ; 2025:39
Nyckelord [en]
Turbulence, Data compression, Data processing, Modal decompositions, Interpolation
Nyckelord [sv]
Turbulens, Datakompression, Databehandling, Modaldekomposition, Interpolation
Nationell ämneskategori
Strömningsmekanik
Forskningsämne
Teknisk mekanik
Identifikatorer
URN: urn:nbn:se:kth:diva-371434ISBN: 978-91-8106-376-9 (tryckt)OAI: oai:DiVA.org:kth-371434DiVA, id: diva2:2005664
Disputation
2025-11-14, F3, Lindstedtvägen 26, Stockholm, 10:15 (Engelska)
Opponent
Handledare
Anmärkning
QC 251013
2025-10-132025-10-102025-10-20Bibliografiskt granskad
Delarbeten