kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Spherical microphone array for studio recording of speech: A subjective evaluation
KTH, School of Electrical Engineering and Computer Science (EECS).
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Sfärisk mikrofonmatris för studioinspelning av tal : en utvärdering (Swedish)
Abstract [en]

With the rise of interest in podcasts and spoken audio media, radio stations are looking for ways to stay in the front line of audio technology development. This means trying new formats and ways of working. A promising technology for this is a type of spherical microphone array: the Ambisonic microphone. It enables the use of minimal gear and flexible post-production. However, the quality of the end result needs to be secured. In this study, 14 subjects were asked to compare the audio of a spoken studio program recorded with a regular close-range microphone with that of the same program recorded with an ambisonic microphone using sound source localization and beamforming. The subjects reported their preferences for each of the ten excerpts of the program on a comparative five-point Likert scale and left free-form answers about their impressions of the audio. The results of the study show a clear preference for the close-range microphone. The main reason stated by the subjects is the lack of lower frequencies in the ambisonic recording, followed by descriptions of the audio as ”tinny” and ”less natural”. Another often-stated reason is the perception of the ambisonic recording as having too much room reverberation. The strength of the preference is indicated to vary between excepts, and some comments suggest that differences in content could be a reason. In the future, it would be interesting to investigate whether the technology could perform better in environments with more movement.

Abstract [sv]

Med det växande intresset för podcasts och talad ljudmedia ligger det i radioleverantörers intresse att hitta nya sätt att befinna sig i framkanten av den ljudtekniska utvecklingen. Detta innebär att ständigt testa nya format och arbetsmetoder. En lovande teknik är en typ av sfärisk mikrofonmatris: Ambisonic-mikrofonen. Den möjliggör inspelning med minimal utrustning såväl som flexibel efterproduktion. För att detta ska bli ett verkligt alternativ måste dock kvaliteten på slutresultatet säkerställas. I denna studie fick 14 försökspersoner jämföra ljudet från två inspelningar av ett talprogram för radio gjorda i studio. Ljudet från samma program spelades in med en konventionell närmikrofon och med en ambisonic-mikrofon med virtuella mikrofoner. Försökspersonerna angav sina preferenser för vart och ett av de tio programutdragen på en femgradig Likert-skala, och fick dessutom beskriva sina intryck ljudet i varje utdrag i textform. Resultaten av studien visar en tydlig preferens för närmikrofonen. Den främsta anledningen försökspersonerna angav var avsaknaden av lägre frekvenser i ambisonic-inspelningen, följt av beskrivningar av ljudet som ”burkigt” och ”mindre naturligt”. En annan anledning som ofta angavs var att ambisonic-inspelningen upplevdes ha för mycket rumsljud. Till vilken grad försökspersonerna föredrog närmikrofonen varierade mellan de olika utdragen, och vissa kommentarer antyder att skillnader i innehåll kan vara en orsak. I framtiden skulle det vara intressant att undersöka om tekniken kan prestera bättre i miljöer med mer rörelse i rummet.

Place, publisher, year, edition, pages
2024. , p. 44
Series
TRITA-EECS-EX ; 2024:567
Keywords [en]
Ambisonics, Spherical microphone array processing, Podcast, Radio, Studio, Beamforming
Keywords [sv]
Ambisonics, Podcast, Radio, Studio, Virtuella mikrofoner
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-352901OAI: oai:DiVA.org:kth-352901DiVA, id: diva2:1896237
External cooperation
Sveriges Radio
Supervisors
Examiners
Available from: 2024-10-02 Created: 2024-09-09 Last updated: 2024-10-02Bibliographically approved

Open Access in DiVA

fulltext(3364 kB)230 downloads
File information
File name FULLTEXT01.pdfFile size 3364 kBChecksum SHA-512
69218dc8e9bf7f4eb12ed9e33865b57a96ec0e78cc310f972d9fc26b6dd55d0c0998e8847cbda97d98ea7211db09a2bc9e58f5f36a4672a9503d2bca946b070e
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 230 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 105 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf