Spherical microphone array for studio recording of speech: A subjective evaluation
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Sfärisk mikrofonmatris för studioinspelning av tal : en utvärdering (Swedish)
Abstract [en]
With the rise of interest in podcasts and spoken audio media, radio stations are looking for ways to stay in the front line of audio technology development. This means trying new formats and ways of working. A promising technology for this is a type of spherical microphone array: the Ambisonic microphone. It enables the use of minimal gear and flexible post-production. However, the quality of the end result needs to be secured. In this study, 14 subjects were asked to compare the audio of a spoken studio program recorded with a regular close-range microphone with that of the same program recorded with an ambisonic microphone using sound source localization and beamforming. The subjects reported their preferences for each of the ten excerpts of the program on a comparative five-point Likert scale and left free-form answers about their impressions of the audio. The results of the study show a clear preference for the close-range microphone. The main reason stated by the subjects is the lack of lower frequencies in the ambisonic recording, followed by descriptions of the audio as ”tinny” and ”less natural”. Another often-stated reason is the perception of the ambisonic recording as having too much room reverberation. The strength of the preference is indicated to vary between excepts, and some comments suggest that differences in content could be a reason. In the future, it would be interesting to investigate whether the technology could perform better in environments with more movement.
Abstract [sv]
Med det växande intresset för podcasts och talad ljudmedia ligger det i radioleverantörers intresse att hitta nya sätt att befinna sig i framkanten av den ljudtekniska utvecklingen. Detta innebär att ständigt testa nya format och arbetsmetoder. En lovande teknik är en typ av sfärisk mikrofonmatris: Ambisonic-mikrofonen. Den möjliggör inspelning med minimal utrustning såväl som flexibel efterproduktion. För att detta ska bli ett verkligt alternativ måste dock kvaliteten på slutresultatet säkerställas. I denna studie fick 14 försökspersoner jämföra ljudet från två inspelningar av ett talprogram för radio gjorda i studio. Ljudet från samma program spelades in med en konventionell närmikrofon och med en ambisonic-mikrofon med virtuella mikrofoner. Försökspersonerna angav sina preferenser för vart och ett av de tio programutdragen på en femgradig Likert-skala, och fick dessutom beskriva sina intryck ljudet i varje utdrag i textform. Resultaten av studien visar en tydlig preferens för närmikrofonen. Den främsta anledningen försökspersonerna angav var avsaknaden av lägre frekvenser i ambisonic-inspelningen, följt av beskrivningar av ljudet som ”burkigt” och ”mindre naturligt”. En annan anledning som ofta angavs var att ambisonic-inspelningen upplevdes ha för mycket rumsljud. Till vilken grad försökspersonerna föredrog närmikrofonen varierade mellan de olika utdragen, och vissa kommentarer antyder att skillnader i innehåll kan vara en orsak. I framtiden skulle det vara intressant att undersöka om tekniken kan prestera bättre i miljöer med mer rörelse i rummet.
Place, publisher, year, edition, pages
2024. , p. 44
Series
TRITA-EECS-EX ; 2024:567
Keywords [en]
Ambisonics, Spherical microphone array processing, Podcast, Radio, Studio, Beamforming
Keywords [sv]
Ambisonics, Podcast, Radio, Studio, Virtuella mikrofoner
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-352901OAI: oai:DiVA.org:kth-352901DiVA, id: diva2:1896237
External cooperation
Sveriges Radio
Supervisors
Examiners
2024-10-022024-09-092024-10-02Bibliographically approved