Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Optimizing Sparse Matrix Assembly in Finite Element Solvers with One-Sided Communication
KTH, Skolan för datavetenskap och kommunikation (CSC), High Performance Computing and Visualization (HPCViz).ORCID-id: 0000-0002-5020-1631
2013 (Engelska)Ingår i: High Performance Computing for Computational Science - VECPAR 2012, Springer Berlin/Heidelberg, 2013, s. 128-139Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

In parallel finite element solvers, sparse matrix assembly is often a bottleneck. Implemented using message passing, latency from message matching starts to limit performance as the number of cores increases. We here address this issue by using our own stack based representation of the sparse matrix, and a hybrid parallel programming model combining traditional message passing with one-sided communication. This gives an significantly faster insertion rate compared to state of the art implementations on a Cray XE6.

Ort, förlag, år, upplaga, sidor
Springer Berlin/Heidelberg, 2013. s. 128-139
Serie
Lecture Notes in Computer Science, ISSN 0302-9743 ; 7851
Nyckelord [en]
UPC, PGAS, Hybrid Parallel Programming
Nationell ämneskategori
Beräkningsmatematik
Identifikatorer
URN: urn:nbn:se:kth:diva-125739DOI: 10.1007/978-3-642-38718-0_15ISI: 000342997100015Scopus ID: 2-s2.0-84883275982ISBN: 978-3-642-38717-3 (tryckt)OAI: oai:DiVA.org:kth-125739DiVA, id: diva2:640313
Konferens
10th International Conference on High Performance Computing for Computational Science, VECPAR 2012; Kobe; Japan; 17 July 2012 through 20 July 2012
Anmärkning

QC 20130815

Tillgänglig från: 2013-08-13 Skapad: 2013-08-13 Senast uppdaterad: 2014-11-13Bibliografiskt granskad
Ingår i avhandling
1. High Performance Adaptive Finite Element Methods: With Applications in Aerodynamics
Öppna denna publikation i ny flik eller fönster >>High Performance Adaptive Finite Element Methods: With Applications in Aerodynamics
2013 (Engelska)Doktorsavhandling, sammanläggning (Övrigt vetenskapligt)
Abstract [en]

The massive computational cost for resolving all scales in a turbulent flow makes a direct numerical simulation of the underlying Navier-Stokes equations impossible in most engineering applications. Recent advances in adaptive finite element methods offer a new powerful tool in Computational Fluid Dynamics (CFD). The computational cost for simulating turbulent flow can be minimized by adaptively resolution of the mesh, based on a posteriori error estimation. Such adaptive methods have previously been implemented for efficient serial computations, but the extension to an efficient parallel solver is a challenging task. This work concerns the development of an adaptive finite element method that enables efficient computation of time resolved approximations of turbulent flow for complex geometries with a posteriori error control. We present efficient data structures and data decomposition methods for distributed unstructured tetrahedral meshes. Our work also concerns an efficient parallelization of local mesh refinement methods such as recursive longest edge bisection, and the development of an a priori predictive dynamic load balancing method, based on a weighted dual graph. We also address the challenges of emerging supercomputer architectures with the development of new hybrid parallel programming models, combining traditional message passing with lightweight one-sided communication. Our implementation has proven to be both general and efficient, scaling up to more than twelve thousands cores.

Abstract [sv]

Den höga beräkningskostnaden för att lösa upp alla turbulenta skalor för ett realistiskt problem gör en direkt numerisk simulering av Navier-Stokes ekvationer omöjlig. De senaste framstegen inom adaptiva finita element metoder ger ett nytt kraftfullt verktyg inom Computational Fluid Dynamics (CFD). Beräkningskostnaden för en simulering av turbulent flöde kan minimeras genom att beräkningsnätet adaptivt förfinas baserat på en a posteriori feluppskattning. Dessa adaptiva metoder har tidigare implementerats för seriella beräkningar, medan en effektiv parallellisering av metoden inte är trivial. I denna avhandling presenterar vi vår utveckling av en adaptiv finita element lösare, anpassad för att effektivt beräkna tidsupplösta approximationer i komplicerade geometrier med a posteriori felkontroll. Effektiva datastrukturer och metoder för ostrukturerade beräkningsnät av tetrahedrar presenteras. Avhandlingen behandlar även effektiv parallellisering av lokala nätförfiningsmetoder, exempelvis recursive longest edge bisection. Även lastbalanseringsproblematiken behandlas, där problemet lösts genom utvecklandet av en prediktiv dynamisk lastbalanseringsmetod, baserad på en viktad dualgraf av beräkningsnätet. Slutligen avhandlas även problematiken med att effektivt utnyttja nytillkomna superdatorarkitekturer, genom utvecklandet av en hybrid parallelliserings modell som kombinerar traditionell meddelande baserad parallellisering med envägskommunikation. Detta har resulterat i en generell samt effektiv implementation med god skalning upp till fler än tolv tusen processorkärnor.

Ort, förlag, år, upplaga, sidor
Stockholm: KTH Royal Institute of Technology, 2013. s. xii, 50
Serie
TRITA-CSC-A, ISSN 1653-5723 ; 2013:07
Nationell ämneskategori
Beräkningsmatematik
Identifikatorer
urn:nbn:se:kth:diva-125742 (URN)978-91-7501-814-0 (ISBN)
Disputation
2013-09-11, F3, Lindstedtsvägen 26, KTH, Stockholm, 10:15 (Engelska)
Opponent
Handledare
Anmärkning

QC 20130816

Tillgänglig från: 2013-08-16 Skapad: 2013-08-13 Senast uppdaterad: 2016-02-02Bibliografiskt granskad

Open Access i DiVA

fulltext(215 kB)1366 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 215 kBChecksumma SHA-512
98ca00d6c9e0ca84acbc25f1e5ef54cff4012d24c39199d970a67b29997931655719c5445f9e2c1ce6eaa5994b1948137ff98a87d7f9c4536568c3f6a7610255
Typ fulltextMimetyp application/pdf

Övriga länkar

Förlagets fulltextScopusSpringer

Personposter BETA

Jansson, Niclas

Sök vidare i DiVA

Av författaren/redaktören
Jansson, Niclas
Av organisationen
High Performance Computing and Visualization (HPCViz)
Beräkningsmatematik

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 1366 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

doi
isbn
urn-nbn

Altmetricpoäng

doi
isbn
urn-nbn
Totalt: 280 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf