kth.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Strong Scaling of OpenACC enabled Nek5000 on several GPU based HPC systems
KTH, Skolan för elektroteknik och datavetenskap (EECS), Centra, Parallelldatorcentrum, PDC.
Uppsala University.
KTH, Skolan för elektroteknik och datavetenskap (EECS), Datavetenskap, Beräkningsvetenskap och beräkningsteknik (CST).ORCID-id: 0000-0003-3374-8093
KTH, Skolan för teknikvetenskap (SCI), Teknisk mekanik, Strömningsmekanik och Teknisk Akustik.ORCID-id: 0000-0002-7448-3290
Visa övriga samt affilieringar
2022 (Engelska)Ingår i: HPCAsia2022: International Conference on High Performance Computing in Asia-Pacific Region, Association for Computing Machinery (ACM) , 2022, s. 94-102Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

We present new results on the strong parallel scaling for the OpenACC-accelerated implementation of the high-order spectral element fluid dynamics solver Nek5000. The test case considered consists of a direct numerical simulation of fully-developed turbulent flow in a straight pipe, at two different Reynolds numbers Reτ = 360 and Reτ = 550, based on friction velocity and pipe radius. The strong scaling is tested on several GPU-enabled HPC systems, including the Swiss Piz Daint system, TACC's Longhorn, Jülich's JUWELS Booster, and Berzelius in Sweden. The performance results show that speed-up between 3-5 can be achieved using the GPU accelerated version compared with the CPU version on these different systems. The run-time for 20 timesteps reduces from 43.5 to 13.2 seconds with increasing the number of GPUs from 64 to 512 for Reτ = 550 case on JUWELS Booster system. This illustrates the GPU accelerated version the potential for high throughput. At the same time, the strong scaling limit is significantly larger for GPUs, at about 2000 - 5000 elements per rank; compared to about 50 - 100 for a CPU-rank.

Ort, förlag, år, upplaga, sidor
Association for Computing Machinery (ACM) , 2022. s. 94-102
Serie
ACM International Conference Proceeding Series
Nationell ämneskategori
Datavetenskap (datalogi) Strömningsmekanik och akustik
Identifikatorer
URN: urn:nbn:se:kth:diva-309189DOI: 10.1145/3492805.3492818Scopus ID: 2-s2.0-85122621284OAI: oai:DiVA.org:kth-309189DiVA, id: diva2:1639938
Konferens
HPC Asia2022: International Conference on High Performance Computing in Asia-Pacific Region Virtual Event Japan January 12 - 14, 2022
Anmärkning

QC 20220223

Part of conference proceedings: ISBN 978-145038498-8

Tillgänglig från: 2022-02-22 Skapad: 2022-02-22 Senast uppdaterad: 2024-03-18Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopus

Person

Vincent, JonathanKarp, MartinPeplinski, AdamJansson, NiclasPodobas, ArturMarkidis, StefanoPleiter, DirkSchlatter, Philipp

Sök vidare i DiVA

Av författaren/redaktören
Vincent, JonathanKarp, MartinPeplinski, AdamJansson, NiclasPodobas, ArturMarkidis, StefanoPleiter, DirkSchlatter, Philipp
Av organisationen
Parallelldatorcentrum, PDCBeräkningsvetenskap och beräkningsteknik (CST)Strömningsmekanik och Teknisk Akustik
Datavetenskap (datalogi)Strömningsmekanik och akustik

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 130 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf