Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Användning av Maskininlärning för att förutse servicekvalitet i VoD och KV tjänster
KTH, School of Engineering Sciences (SCI).
KTH, School of Engineering Sciences (SCI).
2019 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Using Machine Learning Models to Predict Service Quality of VoD and KV Services (English)
Abstract [sv]

En viktig del av online-applikationer är bra servicekvalitet för kunden. Ett effektivt sätt att säkerhetsställa detta är att förutse servicekvaliteten genom att använda statistiska inlärningsmetoder. Det här projektet har som mål att använda två olika maskininlärningsmodeller, Random Forest och Linjär regression, för att i realtid förutse mätresultat av servicekvalitet, i en Video on Demand och en Key-Value Store tjänst. Fokus ligger på modellernas prestanda, men också vilka slutsatser kring systemet man kan dra från att analysera modellerna. Metoden gick ut på att undersöka de viktigaste egenskaperna av systemet för att hitta det optimala förhållandet mellan beräkningstid och noggrannhet. Resultaten visar att Random Forest i de flesta fallen överträffar Linjär regression när det kommer till noggrannheten till förutsägelserna. Vår Random Forest implementation i Python via sci kit learn biblioteket, kunde förutse bildfrekvensen för slumpmässig och cyklisk server belastning, med en noggrannhet på 90,7%-91,5%. Studien presenterar en generell metod över hur man kan använda egenskapsreducering för att hitta vilka delar av systemet som korrelerar till servicekvaliteten, oavsett vilken tjänst, maskininlärningsalgoritm eller server belastning som undersöks. Våra resultat visar att endast en handfull av utvalda egenskaper av systemet behöver observeras för att erhålla en tillräcklig förutsägelse.

Abstract [en]

An essential element to any online application is good service quality at the customers end. An effective way to ensure this is to predict the service quality using statistical learning. This project aims to use two different Machine Learning models, Random Forest and Linear Regression, to predict real-time measurements of service quality, on a Video on Demand and Key-Value store service. The focus is on their performances but the study also looks into what kind of conclusions about the system one can draw from analyzing these models. The method was to investigate the most important features to find the optimal relationship between computational time and accuracy. The study shows that Random Forest in most cases outperforms Linear regression when it comes to accuracy of the predictions. Our Random Forest implementation with the sci kit learn library for Python, was able to predict the video frame rate, for random and cyclic server load patterns, with an accuracy of 90.7-91.5%. The model was also able to predict average response times of a Key-Value store service, with an accuracy of 98-99.2%. This study present a general method of how to use feature reduction to find which parts of the system that correlates to the service quality,regardless of service application, machine learning algorithm or load pattern. Our results show that only a handful of selected features of the system needs to be observed to obtain an adequate prediction.

Place, publisher, year, edition, pages
2019.
Series
TRITA-SCI-GRU ; 2019:236
National Category
Engineering and Technology
Identifiers
URN: urn:nbn:se:kth:diva-255798OAI: oai:DiVA.org:kth-255798DiVA, id: diva2:1341567
Supervisors
Available from: 2019-08-09 Created: 2019-08-09 Last updated: 2019-08-09Bibliographically approved

Open Access in DiVA

No full text in DiVA

By organisation
School of Engineering Sciences (SCI)
Engineering and Technology

Search outside of DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric score

urn-nbn
Total: 59 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf