kth.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Innehållsbaserad uppsnabbning av video
KTH, Skolan för elektroteknik och datavetenskap (EECS).
2022 (Svenska)Självständigt arbete på grundnivå (kandidatexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
Abstract [en]

This report demonstrates and explores alternative methods for speeding up video with associated audio. Two methods have been investigated, these have been combined and evaluated. The first one is to find quiet segments in the video and drastically accelerate them. The other method is to use a speech-to-text service to measure speech speed and speed up the content based on the measured speed, this method proved not to be suitable with the developed implementation together with the chosen speech-to-text software. Dynamically adjusting the speed of audio and video after analyzing for quiet segments is a suitable alternative to a constant speed factor. This method has in some cases made the content easier to understand compared to acceleration with a fixed factor at the same audio and video duration, thus the goal of the work has been fulfilled, although not fully.

Abstract [sv]

Det här arbetet visar och undersöker alternativa metoder för hastighetsökning av video med tillhörande ljud. Två metoder har undersökts, dessa har kombinerats och utvärderats. Den ena metoden som undersökts är att hitta tysta stunder i innehållet och drastiskt accelerera dessa. Den andra metoden är att med hjälp av en tal-till-text tjänst mäta talhastighet och snabba upp innehållet utifrån den uppmätta hastigheten, denna metod visade sig inte vara lämplig med den implementation som tagits fram tillsammans med de tal-till-text-mjukvaror som testats. Att anpassa hastigheten på ljud och video dynamiskt efter analys av tysta stunder är ett lämpligt alternativ till en konstant hastighetsförändring. Denna metod har i vissa fall gjort innehållet lättare att uppfatta och förstå vid samma totala tidslängd på ljud och video jämfört med uppsnabbning med fast faktor, därmed har målet med arbetet uppfyllts, om än inte fullt ut.

Ort, förlag, år, upplaga, sidor
2022. , s. 22
Serie
TRITA-EECS-EX ; 2022:825
Nationell ämneskategori
Data- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:kth:diva-322028OAI: oai:DiVA.org:kth-322028DiVA, id: diva2:1714144
Handledare
Examinatorer
Tillgänglig från: 2023-01-25 Skapad: 2022-11-28 Senast uppdaterad: 2023-01-25Bibliografiskt granskad

Open Access i DiVA

fulltext(522 kB)65 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 522 kBChecksumma SHA-512
21680aa952ec6af58ec6ef39b52a2a8bb9e4921f0420f2023d65c272a02d0cf5a35c1390793b81990ecaf6dde00027f6a5be0affe3b3bdf076fc4a52ba77e98f
Typ fulltextMimetyp application/pdf

Av organisationen
Skolan för elektroteknik och datavetenskap (EECS)
Data- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 65 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 148 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf