Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Towards a Parallel Algebraic Multigrid Solver Using Partitioned Global Address Space
KTH, Skolan för datavetenskap och kommunikation (CSC), High Performance Computing and Visualization (HPCViz).ORCID-id: 0000-0002-5020-1631
2013 (Engelska)Rapport (Övrigt vetenskapligt)
Abstract [en]

The Algebraic Multigrid (AMG) method has over the years developed into an ecient tool for solving unstructured linear systems. The need to solve large industrial problems discretized on unstructured meshes, has been a key motivation for devising a parallel AMG method. Despite some success, the key part of the AMG algorithm; the coarsening step, is far from trivial to parallelize eciently. We here introduce a novel parallelization of the Ruge-Stüben coarsening algorithm, that retains the good interpolation properties of the original method. Our parallelization is based on the Partitioned Global Address Space (PGAS) abstraction, which allows for a simple, yet efficient implementation. The solver is described in detail and a performance study on a Cray XE6 is presented.

Ort, förlag, år, upplaga, sidor
2013. , s. 15
Serie
CTL Technical Report ; 30
Nyckelord [en]
Algebraic Multigrid, PGAS, UPC
Nationell ämneskategori
Beräkningsmatematik
Identifikatorer
URN: urn:nbn:se:kth:diva-125620OAI: oai:DiVA.org:kth-125620DiVA, id: diva2:640298
Anmärkning

QC 20130815

Tillgänglig från: 2013-08-13 Skapad: 2013-08-13 Senast uppdaterad: 2013-08-16Bibliografiskt granskad
Ingår i avhandling
1. High Performance Adaptive Finite Element Methods: With Applications in Aerodynamics
Öppna denna publikation i ny flik eller fönster >>High Performance Adaptive Finite Element Methods: With Applications in Aerodynamics
2013 (Engelska)Doktorsavhandling, sammanläggning (Övrigt vetenskapligt)
Abstract [en]

The massive computational cost for resolving all scales in a turbulent flow makes a direct numerical simulation of the underlying Navier-Stokes equations impossible in most engineering applications. Recent advances in adaptive finite element methods offer a new powerful tool in Computational Fluid Dynamics (CFD). The computational cost for simulating turbulent flow can be minimized by adaptively resolution of the mesh, based on a posteriori error estimation. Such adaptive methods have previously been implemented for efficient serial computations, but the extension to an efficient parallel solver is a challenging task. This work concerns the development of an adaptive finite element method that enables efficient computation of time resolved approximations of turbulent flow for complex geometries with a posteriori error control. We present efficient data structures and data decomposition methods for distributed unstructured tetrahedral meshes. Our work also concerns an efficient parallelization of local mesh refinement methods such as recursive longest edge bisection, and the development of an a priori predictive dynamic load balancing method, based on a weighted dual graph. We also address the challenges of emerging supercomputer architectures with the development of new hybrid parallel programming models, combining traditional message passing with lightweight one-sided communication. Our implementation has proven to be both general and efficient, scaling up to more than twelve thousands cores.

Abstract [sv]

Den höga beräkningskostnaden för att lösa upp alla turbulenta skalor för ett realistiskt problem gör en direkt numerisk simulering av Navier-Stokes ekvationer omöjlig. De senaste framstegen inom adaptiva finita element metoder ger ett nytt kraftfullt verktyg inom Computational Fluid Dynamics (CFD). Beräkningskostnaden för en simulering av turbulent flöde kan minimeras genom att beräkningsnätet adaptivt förfinas baserat på en a posteriori feluppskattning. Dessa adaptiva metoder har tidigare implementerats för seriella beräkningar, medan en effektiv parallellisering av metoden inte är trivial. I denna avhandling presenterar vi vår utveckling av en adaptiv finita element lösare, anpassad för att effektivt beräkna tidsupplösta approximationer i komplicerade geometrier med a posteriori felkontroll. Effektiva datastrukturer och metoder för ostrukturerade beräkningsnät av tetrahedrar presenteras. Avhandlingen behandlar även effektiv parallellisering av lokala nätförfiningsmetoder, exempelvis recursive longest edge bisection. Även lastbalanseringsproblematiken behandlas, där problemet lösts genom utvecklandet av en prediktiv dynamisk lastbalanseringsmetod, baserad på en viktad dualgraf av beräkningsnätet. Slutligen avhandlas även problematiken med att effektivt utnyttja nytillkomna superdatorarkitekturer, genom utvecklandet av en hybrid parallelliserings modell som kombinerar traditionell meddelande baserad parallellisering med envägskommunikation. Detta har resulterat i en generell samt effektiv implementation med god skalning upp till fler än tolv tusen processorkärnor.

Ort, förlag, år, upplaga, sidor
Stockholm: KTH Royal Institute of Technology, 2013. s. xii, 50
Serie
TRITA-CSC-A, ISSN 1653-5723 ; 2013:07
Nationell ämneskategori
Beräkningsmatematik
Identifikatorer
urn:nbn:se:kth:diva-125742 (URN)978-91-7501-814-0 (ISBN)
Disputation
2013-09-11, F3, Lindstedtsvägen 26, KTH, Stockholm, 10:15 (Engelska)
Opponent
Handledare
Anmärkning

QC 20130816

Tillgänglig från: 2013-08-16 Skapad: 2013-08-13 Senast uppdaterad: 2016-02-02Bibliografiskt granskad

Open Access i DiVA

fulltext(2899 kB)401 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 2899 kBChecksumma SHA-512
a3cb8bab1057f0e5ac946a0aa17264f6924d6b739c37304158f600b4a21c84dbdebb75265b9724337000d45ff57578a2d73328e662d8e18d0499b8afb66bd941
Typ fulltextMimetyp application/pdf

Personposter BETA

Jansson, Niclas

Sök vidare i DiVA

Av författaren/redaktören
Jansson, Niclas
Av organisationen
High Performance Computing and Visualization (HPCViz)
Beräkningsmatematik

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 401 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 297 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf