kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Technical and Organizational Effects of Retrieval-Augmented Generation for Math Tutoring
KTH, School of Electrical Engineering and Computer Science (EECS).
KTH, School of Electrical Engineering and Computer Science (EECS).
2024 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Tekniska och organisatoriska effekter av retrieval-augmented generation för matematikläxhjälp (Swedish)
Abstract [en]

While large language models (LLMs) have proven useful in many areas, they still have the disadvantage of sometimes hallucinating and providing incorrect or illogical answers. In areas like mathematics tutoring, faults like these are detrimental to the usability of LLM systems. Retrieval-augmented generation (RAG) is a method to combat these drawbacks. With RAG, an external database containing information relevant to the system’s area of application (e.g. a math textbook) is paired with the LLM. User prompts are combined with relevant documents from the external database, and these combinations are used as the final prompts to the LLM, thereby giving it access to the added context of the retrieved documents. In this article, we implement RAG for online elementary and high school mathematics tutoring to answer the question of whether RAG will bring improvements to LLM responses in this area. We also assess the attitudes toward using artificial intelligence at work among a group of tutors at an online mathematics tutoring organization, and what kind of effects RAG could have on these attitudes. Data to answer these research questions was collected via a survey sent to the tutors at the tutoring organization. Our results show that RAG had an insignificant effect on the assessed quality of LLM responses. However, RAG might be valuable from an organizational perspective as it brought (admittedly statistically insignificant) improvements in many important metrics. We theorize that the lackluster effects of RAG are explained by the LLM not needing the additional context supplied by the retrieved documents.

Abstract [sv]

Stora språkmodeller har visat sig vara användbara inom många områden, men de har fortfarande nackdelen att de ibland hallucinerar och ger felaktiga eller ologiska svar. Inom områden som matematikläxhjälp skadar brister av denna typ användbarheten hos stora språkmodeller. Retrieval-augmented generation (RAG) är en metod för att motverka dessa brister. RAG innehbär att en extern databas med för tillämpningsområdet relevant information (exempelvis en lärobok i matematik) kopplas till den stora språkmodellen. Användarprompts kombineras med relevanta dokument ur den externa databasen. Dessa kombinationer ges sedan som slutgiltiga prompts till den stora språkmodellen, som därigenom får tillgång till den extra kontext som de hämtade dokumenten tillför. I denna artikel implementerar vi RAG för nätbaserad matematikläxhjälp riktad mot grundskole- och gymnasieelever. Med hjälp av denna implementation undersöker vi frågan om RAG förbättrar svar från stora språkmodeller inom området. Vi undersöker dessutom inställningarna till artificiell intelligens på arbetet hos arbetande på en nätbaserad matematikläxhjälpsorganisation, samt vilken potential RAG har att ändra dessa inställningar. Data för att svara på dessa frågeställningar samlades in genom en enkät skickad till de arbetande på läxhjälpsorganisationen. Våra resultat visar att RAG har en liten och statistiskt insignifikant effekt på den upplevda kvaliteten hos svaren från en stor språkmodell. Däremot kan inte användandet av RAG förkastas ur ett organisatoriskt perspektiv eftersom RAG-arkitekturen medförde förbättringar i många viktiga avseenden (utan statistisk signifikans). Vi föreslår att den insignifikanta effekt RAG har kan bero på att den extra kontext som de hämtade dokumenten medför är onödig för den stora språkmodellen.

Place, publisher, year, edition, pages
2024. , p. 11
Series
TRITA-EECS-EX ; 2024:422
Keywords [en]
artifical intelligence (AI), employee attitudes, human resource management (HRM), large language models (LLMs), mathematics tutoring, retrieval-augmented generation (RAG)
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-351256OAI: oai:DiVA.org:kth-351256DiVA, id: diva2:1886754
Supervisors
Examiners
Available from: 2024-09-19 Created: 2024-08-04 Last updated: 2024-09-19Bibliographically approved

Open Access in DiVA

fulltext(706 kB)132 downloads
File information
File name FULLTEXT01.pdfFile size 706 kBChecksum SHA-512
4fdd81766133d5071b487cdb7c31462c9e14967a9022d833e15ddb05037c57ec33dae5a1afadf46ee84701360faa4078ad04a7be278c247b10044dd697a24671
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 132 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 408 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf