kth.sePublikationer KTH
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Green MIR?: Investigating computational cost of recent music-Ai research in ISMIR
KTH, Skolan för elektroteknik och datavetenskap (EECS), Människocentrerad teknologi, Medieteknik och interaktionsdesign, MID.ORCID-id: 0000-0003-1679-6018
KTH, Skolan för elektroteknik och datavetenskap (EECS), Människocentrerad teknologi, Medieteknik och interaktionsdesign, MID.ORCID-id: 0000-0002-7605-0093
KTH, Skolan för elektroteknik och datavetenskap (EECS), Människocentrerad teknologi, Medieteknik och interaktionsdesign, MID.ORCID-id: 0000-0002-0028-9030
2024 (Engelska)Ingår i: Proceedings of the 25th International Society for Music Information Retrieval (ISMIR) Conference, 2024, s. 371-380Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

The environmental footprint of Generative AI and other Deep Learning (DL) technologies is increasing. To understand the scale of the problem and to identify solutions for avoiding excessive energy use in DL research at communities such as ISMIR, more knowledge is needed of the current energy cost of the undertaken research. In this paper, we provide a scoping inquiry of how the ISMIR research concerning automatic music generation (AMG) and computing-heavy music analysis currently discloses information related to environmental impact. We present a study based on two corpora that document 1) ISMIR papers published in the years 2017–2023 that introduce an AMG model, and 2) ISMIR papers from the years 2022–2023 that propose music analysis models and include heavy computations with GPUs. Our study demonstrates a lack of transparency in model training documentation. It provides the first estimates of energy consumption related to model training at ISMIR, as a baseline for making more systematic estimates about the energy footprint of the ISMIR conference in relation to other machine learning events. Furthermore, we map the geographical distribution of generative model contributions and discuss the corporate role in the funding and model choices in this body of work.

Ort, förlag, år, upplaga, sidor
2024. s. 371-380
Nyckelord [en]
music information retrieval, MIR, sustainability, energy, generative AI, deep learning
Nationell ämneskategori
Musik Datavetenskap (datalogi)
Identifikatorer
URN: urn:nbn:se:kth:diva-356910DOI: 10.5281/zenodo.14877351Scopus ID: 2-s2.0-85219635914OAI: oai:DiVA.org:kth-356910DiVA, id: diva2:1916342
Konferens
International Society for Music Information Retrieval Conference (ISMIR), San Francisco, California, United States of America, November 10-14, 2024
Forskningsfinansiär
Marianne och Marcus Wallenbergs Stiftelse
Anmärkning

Part of ISBN 978-1-7327299-4-0

QC 20250313

Tillgänglig från: 2024-11-27 Skapad: 2024-11-27 Senast uppdaterad: 2025-03-13Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopus

Person

Holzapfel, AndreKaila, Anna-KaisaJääskeläinen, Petra

Sök vidare i DiVA

Av författaren/redaktören
Holzapfel, AndreKaila, Anna-KaisaJääskeläinen, Petra
Av organisationen
Medieteknik och interaktionsdesign, MID
MusikDatavetenskap (datalogi)

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 439 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf