Change search
ReferencesLink to record
Permanent link

Direct link
Linked data performance in different databases: Comparison between SQL and NoSQL databases
KTH, School of Technology and Health (STH), Medical Engineering, Computer and Electronic Engineering.
KTH, School of Technology and Health (STH), Medical Engineering, Computer and Electronic Engineering.
2014 (English)Independent thesis Basic level (university diploma), 10 credits / 15 HE creditsStudent thesisAlternative title
Prestanda med länkad data i olika databaser : Jämförelse mellan SQL och NoSQL databaser (Swedish)
Abstract [en]

Meepo AB was investigating the possibility of developing a social rating and recommendation service. In a recommendation service, the user ratings are collected in a database, this data is then used in recommendation algorithms to create individual user recommendations.

The purpose of this study was to find out which  demands are put on a DBMS, database management system, powering a recommendation service, what impact the NoSQL databases have on the performance of recommendation services compared to traditional relational databases, and which DBMS is most suited for storing the data needed to host a recommendation service.

Five distinct NoSQL and Relational DBMS were examined, from these three candidates were chosen for a closer comparison.

Following a study of recommendation algorithms and services, a test suite was created to compare DBMS performance in different areas using a data set of 100 million ratings.

The results show that MongoDB had the best performance in most use cases, while Neo4j and MySQL struggled with queries spanning the whole data set.

This paper however never compared performance for real production code. To get a better comparison, more research is needed. We recommend new performance tests for MongoDB and Neo4j using implementations of recommendation algorithms, a larger data set, and more powerful hardware.

Abstract [sv]

Meepo AB undersökte möjligheten att utveckla en social betygs- och rekommendationstjänst. I en rekommendationstjänst samlas användarbetyg i en databas, för att sedan användas i en rekommendationsalgoritm för att skapa individuella rekommendationer till användarna.

Syftet med studien var att ta reda på vilka krav som ställs på ett DBMS, databassystem, som driver en rekommendationstjänst, vilken inverkan NoSQL-databaser har på prestandan för rekommendationstjänster jämfört med traditionella relationsdatabaser och vilket DBMS som är mest lämpat för användning i en rekommendation tjänst.

Fem olika NoSQL- och Relationsdatabaser undersöktes, från dessa valdes tre kandidater ut för en närmare jämförelse. Efter en studie i rekommendationsalgoritmer och rekommendationstjänster skapades en testsvit för att jämföra databasernas prestanda i olika områden. Till detta användes ett dataset med 100 miljoner betyg.

Resultaten visar att MongoDB hade bäst prestanda i flest användningsfall, medan Neo4j och MySQL hade problem med sökningar som sträcker sig över hela datasetet.

I denna uppsats jämförs dock inte prestandan med riktig produktionskod. För en bättre jämförelse behövs mer forskning. Vi rekommenderar nya prestandamätningar för MongoDB och Neo4j med implementationer av rekommendationsalgoritmer, ett större dataset och mer kraftfull hårdvara.

Place, publisher, year, edition, pages
2014. , 62 p.
TRITA-STH, 2014:67
Keyword [en]
Database, DBMS, Performance, NoSQL, SQL, Data
National Category
Computer Engineering
URN: urn:nbn:se:kth:diva-146602OAI: diva2:724365
Subject / course
Computer Technology, Program- and System Development
Educational program
Bachelor of Science in Engineering - Computer Engineering
Available from: 2014-12-16 Created: 2014-06-12 Last updated: 2014-12-16Bibliographically approved

Open Access in DiVA

fulltext(1172 kB)276 downloads
File information
File name FULLTEXT01.pdfFile size 1172 kBChecksum SHA-512
Type fulltextMimetype application/pdf

By organisation
Computer and Electronic Engineering
Computer Engineering

Search outside of DiVA

GoogleGoogle Scholar
Total: 276 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

Total: 871 hits
ReferencesLink to record
Permanent link

Direct link