kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Predicting Patent Data using Wavelet Regression and Bayesian Machine Learning
KTH, School of Engineering Sciences (SCI), Mathematics (Dept.), Mathematics (Div.).
2023 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Modellering av Patentdata med Wavelet Regression och Bayesiansk Maskininlärning (Swedish)
Abstract [en]

Patents are a fundamental part of scientific and engineering work, ensuringprotection of inventions owned by individuals or organizations. Patents areusually made public 18 months after being filed to a patent office, whichmeans that current publicly available patent data only provides informationabout the past. Regression models applied on discrete time series can be usedas a prediction tool to counteract this, building a 18 month long bridge intothe future and beyond. While linear models are popular for their simplicity,Bayesian networks have statistical properties that can produce high forecastingquality. Improvements is also made by using signal processing as patentdata is naturally stochastic. This thesis implements wavelet-based signalprocessing and P CA to increase stability and reduce overfitting. A multiplelinear regression model and a Bayesian network model is then designed andapplied to the transformed data. When evaluated on each data set, the Bayesianmodel both performs better and exhibits greater stability and consistency inits predictions. As expected, the linear model is both smaller and faster toevaluate and train. Despite an increase in complexity and slower evaluationtimes, the Bayesian model is conclusively superior to the linear model. Futurework should focus on the signal processing method and additional layers inthe Bayesian network.

Abstract [sv]

Patent är en grundläggande byggsten av den tekniska världen då de skyddaruppfinningar som ägs av individer eller organisationer. Patent publicerasvanligtvis 18 månader efter att de lämnats in till ett patentverk, vilket innebäratt patentdata som är tillgänglig idag endast ger information om det förflutna.Regressionsmodeller som förutspår diskreta tidsserier kan användas somett verktyg för att motverka detta. Då linjära modeller är populära för sinenkelhet, har Bayesianska nätverk statistiska egenskaper som kan produceramodeller med hög kvalité. Patentdata är naturligt kaotisk och måste bearbetasinnan en modell använder den. Denna uppsats implementerar wavelet-baseradsignalbehandling och P CA som förbättrar stabilitet och kvalité. En linjärregressionsmodell och en Bayesiansk nätverksmodell designas och applicerassedan på transformerad data. I varje enskilt fall presterar den Bayesianskamodellen bättre med stabila och konsekventa förutsägelser. Som förväntatär den linjära modellen snabbare att både använda och träna. Trots en ökadkomplexitet och långsammare evaluering är den Bayesianska modellen ettsjälvklart val över den linjära modellen. Framtida förbättringar bör fokuserapå behandling av indata och komplexiteten i det Bayesianska nätverket.

Place, publisher, year, edition, pages
2023. , p. 52
Series
TRITA-SCI-GRU ; 2023:299
Keywords [en]
Wavelet, Regression, Bayesian network, Prediction, Patent, Machine Learning
Keywords [sv]
Wavelet, Regression, Bayesiskt nätverk, Predicering, Patent, Maskininlärning
National Category
Computational Mathematics
Identifiers
URN: urn:nbn:se:kth:diva-335330OAI: oai:DiVA.org:kth-335330DiVA, id: diva2:1794337
External cooperation
IamIP Sverige AB
Subject / course
Mathematics
Educational program
Master of Science - Applied and Computational Mathematics
Supervisors
Examiners
Available from: 2023-09-06 Created: 2023-09-05 Last updated: 2023-09-06Bibliographically approved

Open Access in DiVA

fulltext(2135 kB)156 downloads
File information
File name FULLTEXT01.pdfFile size 2135 kBChecksum SHA-512
6b5727a3cab99e275c066eee4491c26318c67e130f796ab16246cdef455eac6f94517e7560fe4707a762651732d339ccd5bd9b02fc5fd60623e37fb12ac26f21
Type fulltextMimetype application/pdf

By organisation
Mathematics (Div.)
Computational Mathematics

Search outside of DiVA

GoogleGoogle Scholar
Total: 157 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 305 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf