Endre søk
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Innehållsbaserad uppsnabbning av video
KTH, Skolan för elektroteknik och datavetenskap (EECS).
2022 (svensk)Independent thesis Basic level (degree of Bachelor), 10 poäng / 15 hpOppgave
Abstract [en]

This report demonstrates and explores alternative methods for speeding up video with associated audio. Two methods have been investigated, these have been combined and evaluated. The first one is to find quiet segments in the video and drastically accelerate them. The other method is to use a speech-to-text service to measure speech speed and speed up the content based on the measured speed, this method proved not to be suitable with the developed implementation together with the chosen speech-to-text software. Dynamically adjusting the speed of audio and video after analyzing for quiet segments is a suitable alternative to a constant speed factor. This method has in some cases made the content easier to understand compared to acceleration with a fixed factor at the same audio and video duration, thus the goal of the work has been fulfilled, although not fully.

Abstract [sv]

Det här arbetet visar och undersöker alternativa metoder för hastighetsökning av video med tillhörande ljud. Två metoder har undersökts, dessa har kombinerats och utvärderats. Den ena metoden som undersökts är att hitta tysta stunder i innehållet och drastiskt accelerera dessa. Den andra metoden är att med hjälp av en tal-till-text tjänst mäta talhastighet och snabba upp innehållet utifrån den uppmätta hastigheten, denna metod visade sig inte vara lämplig med den implementation som tagits fram tillsammans med de tal-till-text-mjukvaror som testats. Att anpassa hastigheten på ljud och video dynamiskt efter analys av tysta stunder är ett lämpligt alternativ till en konstant hastighetsförändring. Denna metod har i vissa fall gjort innehållet lättare att uppfatta och förstå vid samma totala tidslängd på ljud och video jämfört med uppsnabbning med fast faktor, därmed har målet med arbetet uppfyllts, om än inte fullt ut.

sted, utgiver, år, opplag, sider
2022. , s. 22
Serie
TRITA-EECS-EX ; 2022:825
HSV kategori
Identifikatorer
URN: urn:nbn:se:kth:diva-322028OAI: oai:DiVA.org:kth-322028DiVA, id: diva2:1714144
Veileder
Examiner
Tilgjengelig fra: 2023-01-25 Laget: 2022-11-28 Sist oppdatert: 2023-01-25bibliografisk kontrollert

Open Access i DiVA

fulltext(522 kB)65 nedlastinger
Filinformasjon
Fil FULLTEXT01.pdfFilstørrelse 522 kBChecksum SHA-512
21680aa952ec6af58ec6ef39b52a2a8bb9e4921f0420f2023d65c272a02d0cf5a35c1390793b81990ecaf6dde00027f6a5be0affe3b3bdf076fc4a52ba77e98f
Type fulltextMimetype application/pdf

Av organisasjonen

Søk utenfor DiVA

GoogleGoogle Scholar
Totalt: 65 nedlastinger
Antall nedlastinger er summen av alle nedlastinger av alle fulltekster. Det kan for eksempel være tidligere versjoner som er ikke lenger tilgjengelige

urn-nbn

Altmetric

urn-nbn
Totalt: 148 treff
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf