Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
RegressionModeling from the Statistical Learning Perspective - with an Application toAdvertisement Data
KTH, Skolan för teknikvetenskap (SCI), Matematik (Inst.), Matematisk statistik.
2018 (Engelska)Självständigt arbete på avancerad nivå (masterexamen), 20 poäng / 30 hpStudentuppsats (Examensarbete)Alternativ titel
Regressionsmodellering från perspektivet av statistiskinlärning  med tillämpning på  annonsdata (Svenska)
Abstract [en]

Advertising on social media, and on Facebook in specific, is a global industry from which the social media platforms get their biggest revenues. The performance of these advertisements in relation to the money invested in the advertisement can be measured in the metric cost per thousand impressions (CPM). Various regression modelling strategies combined with statistical learning approaches for model assessment are explored in this thesis with the objective of finding the model that best predicts CPM. Using advertisement data for 540 companies in Sweden during 2017, it is found that the data set comprising of 12 covariates suffers from a high degree of multicollinearity. To tackle this problem efficiently we apply different shrinkage regression methods. Starting from the Ridge and Lasso regression methods, combining the two by an elastic net and then finally expanding Lasso to adaptive Lasso, using cross-validation we find that the elastic net with approximately equal weightson Ridge and Lasso component is the best performing model. In conclusion, when regressing a metric such as CPM, on a set of variables which suffers from severe problems of multicollinearity, the shrinkage regression techniques are needed.

Abstract [sv]

Annonsering på sociala medier, och speciellt på Facebook, är en global industri som de sociala medieplattformarna har som största intäktskälla. Hur lyckosamma dessa annonser är i förhållande till hur mycket pengar som investeras i dem kan mätas med nyckeltalet kostnad per tusen intryck (eng: Cost per thousand impressions, CPM). I den här uppsatsen är olika regressionsmodeller av statistisk inlärning byggda för prediktering av CPM med syftet att hitta den modell som bäst kan prediktera CPM. Genom att använda 540 företags annonsdata i Sverige under 2017 upptäcks det  att de 12 förklaringsvariablerna kraftigt samvarierar varav olika shrinkage regressionsmodeller byggs. Genom att först använda Ridge och Lasso, vilka sen kombineras i ett elastiskt nät och slutligen genom att utvidga Lasso till elastisk Lasso, upptäcks det att den modell som presterar bäst utifrån cross-validation är det elastiska nätet där ungefärligen lika stora vikter läggs på Ridge och Lasso. Slutsatsen är att för att regressera ett nyckeltal som CPM, där det är sannolikt att förklaringsvariablerna samvarierar, är shrinkage regressionsmodeller att föredra.

Ort, förlag, år, upplaga, sidor
2018.
Serie
TRITA-SCI-GRU ; 2018:56
Nationell ämneskategori
Beräkningsmatematik
Identifikatorer
URN: urn:nbn:se:kth:diva-229963OAI: oai:DiVA.org:kth-229963DiVA, id: diva2:1215812
Externt samarbete
Whispr Group
Ämne / kurs
Matematisk statistik
Utbildningsprogram
Teknologie masterexamen - Tillämpad matematik och beräkningsmatematik
Handledare
Examinatorer
Tillgänglig från: 2018-06-09 Skapad: 2018-06-09 Senast uppdaterad: 2018-06-09Bibliografiskt granskad

Open Access i DiVA

fulltext(2081 kB)133 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 2081 kBChecksumma SHA-512
a457d8acd9ad06d1694fcb372fa333410380b8b3f4c729e490ab4acf58d0550ff794efe7aabc1bf5379b6d56b22b64113a78f99a497fd6a1b3814da27e0640b0
Typ fulltextMimetyp application/pdf

Av organisationen
Matematisk statistik
Beräkningsmatematik

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 133 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 234 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf