kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Innehållsbaserad uppsnabbning av video
KTH, School of Electrical Engineering and Computer Science (EECS).
2022 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesis
Abstract [en]

This report demonstrates and explores alternative methods for speeding up video with associated audio. Two methods have been investigated, these have been combined and evaluated. The first one is to find quiet segments in the video and drastically accelerate them. The other method is to use a speech-to-text service to measure speech speed and speed up the content based on the measured speed, this method proved not to be suitable with the developed implementation together with the chosen speech-to-text software. Dynamically adjusting the speed of audio and video after analyzing for quiet segments is a suitable alternative to a constant speed factor. This method has in some cases made the content easier to understand compared to acceleration with a fixed factor at the same audio and video duration, thus the goal of the work has been fulfilled, although not fully.

Abstract [sv]

Det här arbetet visar och undersöker alternativa metoder för hastighetsökning av video med tillhörande ljud. Två metoder har undersökts, dessa har kombinerats och utvärderats. Den ena metoden som undersökts är att hitta tysta stunder i innehållet och drastiskt accelerera dessa. Den andra metoden är att med hjälp av en tal-till-text tjänst mäta talhastighet och snabba upp innehållet utifrån den uppmätta hastigheten, denna metod visade sig inte vara lämplig med den implementation som tagits fram tillsammans med de tal-till-text-mjukvaror som testats. Att anpassa hastigheten på ljud och video dynamiskt efter analys av tysta stunder är ett lämpligt alternativ till en konstant hastighetsförändring. Denna metod har i vissa fall gjort innehållet lättare att uppfatta och förstå vid samma totala tidslängd på ljud och video jämfört med uppsnabbning med fast faktor, därmed har målet med arbetet uppfyllts, om än inte fullt ut.

Place, publisher, year, edition, pages
2022. , p. 22
Series
TRITA-EECS-EX ; 2022:825
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-322028OAI: oai:DiVA.org:kth-322028DiVA, id: diva2:1714144
Supervisors
Examiners
Available from: 2023-01-25 Created: 2022-11-28 Last updated: 2023-01-25Bibliographically approved

Open Access in DiVA

fulltext(522 kB)65 downloads
File information
File name FULLTEXT01.pdfFile size 522 kBChecksum SHA-512
21680aa952ec6af58ec6ef39b52a2a8bb9e4921f0420f2023d65c272a02d0cf5a35c1390793b81990ecaf6dde00027f6a5be0affe3b3bdf076fc4a52ba77e98f
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 65 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 148 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf