Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Nekbone performance on GPUs with OpenACC and CUDA Fortran implementations
KTH, Skolan för datavetenskap och kommunikation (CSC), Centra, Parallelldatorcentrum, PDC. KTH, Centra, SeRC - Swedish e-Science Research Centre.ORCID-id: 0000-0002-3859-9480
KTH, Skolan för datavetenskap och kommunikation (CSC), Centra, Parallelldatorcentrum, PDC.ORCID-id: 0000-0003-0639-0639
KTH, Skolan för datavetenskap och kommunikation (CSC), Centra, Parallelldatorcentrum, PDC.ORCID-id: 0000-0002-9901-9857
Visa övriga samt affilieringar
2016 (Engelska)Ingår i: Journal of Supercomputing, ISSN 0920-8542, E-ISSN 1573-0484, Vol. 72, nr 11, s. 4160-4180Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

We present a hybrid GPU implementation and performance analysis of Nekbone, which represents one of the core kernels of the incompressible Navier-Stokes solver Nek5000. The implementation is based on OpenACC and CUDA Fortran for local parallelization of the compute-intensive matrix-matrix multiplication part, which significantly minimizes the modification of the existing CPU code while extending the simulation capability of the code to GPU architectures. Our discussion includes the GPU results of OpenACC interoperating with CUDA Fortran and the gather-scatter operations with GPUDirect communication. We demonstrate performance of up to 552 Tflops on 16, 384 GPUs of the OLCF Cray XK7 Titan.

Ort, förlag, år, upplaga, sidor
Springer, 2016. Vol. 72, nr 11, s. 4160-4180
Nyckelord [en]
Nekbone/Nek5000, OpenACC, CUDA Fortran, GPUDirect, Gather-scatter communication, Spectral element discretization
Nationell ämneskategori
Elektroteknik och elektronik
Identifikatorer
URN: urn:nbn:se:kth:diva-198970DOI: 10.1007/s11227-016-1744-5ISI: 000387234200007Scopus ID: 2-s2.0-84978656496OAI: oai:DiVA.org:kth-198970DiVA, id: diva2:1065628
Forskningsfinansiär
Swedish e‐Science Research Center
Anmärkning

QC 20170116

Tillgänglig från: 2017-01-16 Skapad: 2016-12-22 Senast uppdaterad: 2017-08-16Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopus

Personposter BETA

Gong, JingMarkidis, StefanoLaure, Erwin

Sök vidare i DiVA

Av författaren/redaktören
Gong, JingMarkidis, StefanoLaure, Erwin
Av organisationen
Parallelldatorcentrum, PDCSeRC - Swedish e-Science Research Centre
I samma tidskrift
Journal of Supercomputing
Elektroteknik och elektronik

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 148 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf