CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Automated Text Analysis of Online Content in Marketing: Dictionray-Based Methods and Artificial Intelligence
KTH, School of Industrial Engineering and Management (ITM), Industrial Economics and Management (Dept.).ORCID iD: 0000-0002-2343-9361
2020 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]

Far more than products or services, words are the most fundamental element in the exchanges between sellers and buyers. Understanding the words that constitute the text that is created when sellers and buyers interact with each other is therefore critical for marketing decision makers. This has become especially relevant in the age of the internet, and particularly with the advent of social media. In the pre-computer age, the content analysis of text was a time-consuming, laborious and frequently error-prone tool for marketing scholars and practitioners to use. Now, powerful computers and software enable the content analysis of text to be performed rapidly, and with little human effort or error. Two fundamental types of tools that enable the automated analysis of text are those that are dictionary-based and those that are artificial intelligence-based. The former automated text analysis tools rely on pre-constructed dictionaries, and then scan a piece of text in order to count and match the words in it to obtain scores on the dimensions of interest. Artificial intelligence-based automated text analysis tools employ machine learning algorithms to recognize patterns in text. They compare text to other pre-classified texts, having been trained by human experts to recognize the desired dimensions of a construct, and can “learn” to do this more effectively the more they are used. 

The service dominant logic perspective on marketing holds that value is co-created by both sellers and buyers. This enables the identification of two fundamental marketing focus activities. First, sellers and buyers engage in acts of creation; second, sellers and buyers engage in acts of experience. On a wide range of forums, both buyers and sellers create text about these marketing focus activities. This text lends itself to analysis by the two categories of automated text analysis tools. Therefore, the central question is: How can automated textual analysis tools enable marketing practitioners and scholars to gain insights from different types of textual data? 

Marketing scholars have recently given more attention to the use of automated text analysis tools in marketing research. These efforts have included overviews of the approach, suggestions on choosing amongst methods, and considerations of the sampling and statistical issues unique to automated text analysis. Less emphasis has been placed on specifically examining the use of the two different types of automated text analysis tools (dictionary-based and artificial intelligence based) in exploring the text generated by sellers and buyers in the context of the focal marketing activities of creation and experience. The current research therefore explores the following four research questions:

 

  • RQ1: What insights can an artificial intelligence-based automated text analysis tool deliver from depth interviews with respondents engaged in a creative focus activity?
  • RQ2: What insights can an artificial intelligence-based automated text analysis tool deliver from online reviews by respondents engaged in an experience focus activity?
  • RQ3: What insights can a dictionary-based automated text analysis tool deliver from online reviews by respondents engaged in an experience focus activity?
  • RQ4: What insights can a dictionary-based automated text analysis tool deliver from online interviews by respondents engaged in a creation focus activity

 

The empirical part of this research covered four papers, all of which involved analyzing textual data with the two categories of automated text analysis tools. Two of these papers used artificial intelligence-based automated text analysis tools in both the creation and experience settings, and the other two used dictionary-based automated text analysis tools, again, in these settings. 

The overall contribution to the body of knowledge is to provide evidence of the applicability of both artificial intelligence-based- and dictionary-based automated text analysis tools in two fundamental marketing focus activities, namely, creation and experience. The individual papers also 

 

further our understanding of the use of automated text analysis to study comparisons between groups, as well as correlation between traits and ways of speaking within samples of text.

The document is organised as an overall introduction to the research narrative of four related published papers. The document opens with a chapter providing an overview of automated text analysis in marketing, the statement of the overall research problem, and the identification of four 

research sub-questions. This is followed by a chapter on the literature review. Next is a chapter on the methodology used in the studies. The fourth chapter considers the four papers in more detail, acknowledging their limitations, identifying the implications for marketing practice, and suggesting avenues for future research by marketing scholars. The four papers follow under Chapter 5 at the end. Three of these papers have either been published or accepted for publication; the other is in the second round of revision and resubmission.

Abstract [sv]

I högre grad än produkter eller tjänster är ord det mest grundläggande elementet i utbytet mellan säljare och köpare. Att förstå orden i den text som skapas när säljare och köpare interagerar med varandra är därför avgörande för beslutsfattare för marknadsföring. Detta har blivit extra relevant i och med internet, och särskilt med tillkomsten av sociala medier. Innan datorer användes var innehållsanalysen av text ett tidskrävande, mödosamt och felsbenäget verktyg för både forskare och marknadsförare. Nu möjliggör kraftfulla datorer och programvaror att innehållsanalysen av text kan utföras snabbt, med liten mänsklig inblandning och färre fel. Det finns två grundläggande typer av automatiserade verktyg för textanalys: baserade på ordlistor eller artificiell intelligens (AI). De tidigare automatiserade textanalysverktygen förlitade sig på förkonstruerade ordlistor, skannade sedan en text för att kunna räkna och matcha orden i texten, och sist räkna ut poäng på dimensioner av intresse. Nu använder AI-baserade automatiserade textanalysverktyg maskininlärningsalgoritmer för att känna igen mönster i text. De jämför en text med andra förklassificerade texter, efter att ha utbildats av mänskliga experter för att känna igen de önskade dimensioner av ett begrepp, och kan ”lära sig” att göra detta mer effektivt ju mer de används.

I marknadsföring anger Service-Dominant Logic (S-D logic) perspektivet att värde skapas av både säljare och köpare. Detta möjliggör identifiering av två grundläggande aktiviteter för marknadsföringsfokus. För det första deltar säljare och köpare i skapande. Till exempel skapar en säljare en ny tjänst eller en reklamkampanj, och en köpare skapar en samling (t ex. konst) eller ett recept för hemmabruk. För det andra deltar säljare och köpare i upplevelser. Till exempel upplever marknadsföringschefer resultaten av sin marknadsföringsstrategi eller lyssnar på kunder i en fokusgruppintervju, och köpare upplever att äta på en restaurang eller att få behandling på ett spa. Både köpare och säljare skapar text om dessa marknadsföringsfokusaktiviteter i många olika forum. Dessa texter lämpar sig för analys av de två ovan nämnda kategorierna av automatiserade verktyg för textanalys. Därför är den centrala frågan: Hur kan automatiserade textanalysverktyg göra det möjligt för marknadsförare och forskare att få insikter från olika typer av textdata?

Forskare inom marknadsföring har nyligen involverat automatiserade textanalysverktyg i forskningen. Dessa initiativ har inkluderat en generell överblick av dess tillvägagångssätt, förslag på val av metoder och överväganden inför urval, samt statistiska frågor som är unika för automatiserad textanalys. Mindre fokus har lagts på att specifikt undersöka användningen av de två olika typerna av automatiserade textanalysverktyg (ordlistebaserad och artificiellt intelligensbaserad) för att utforska den text som genereras av säljare och köpare i samband med skapande och erfarenhet av marknadsföringsaktiviteter. Forskningen in denna avhandling undersöker därför följande fyra forskningsfrågor:

 

  • Fråga 1: Vilka marknadsföringsinsikter kan ett artificiellt intelligensbaserat automatiserat textanalysverktyg leverera från djupintervjuer i en skapande fokusaktivitet?
  • Fråga 2: Vilka marknadsföringsinsikter kan ett artificiellt intelligensbaserat automatiserat textanalysverktyg leverera från online-recensioner i en upplevelsebaserad fokusaktivitet?
  • Fråga 3: Vilka marknadsföringsinsikter kan ett ordlistebaserat automatiserat textanalysverktyg leverera från online-recensioner i en upplevelsebaserad fokusaktivitet?
  • Fråga 4: Vilka marknadsföringsinsikter kan ett ordlistebaserat automatiserat textanalysverktyg leverera från intervjuer med svarande i en skapande fokusaktivitet?

 

Den empiriska delen av denna forskning omfattade fyra artiklar, som alla använde textanalys med de två kategorierna av automatiserade textanalysverktyg. Två av dessa artiklar använde artificiellt-intelligensbaserade automatiserad textanalysverktyg i både skapande- och upplevelsesammanhang, och de andra två använde ordlistebaserade automatiserade textanalysverktyg, återigen, i dessa sammanhang. I den första artikeln användes IBMs artificiella intelligens-baserade verktyg Watson för att identifiera de sk.

 

Big Five-personlighetsdrag för ett urval av konstsamlare baserat på utskrifter av 

djupintervjuer som genomförts med dem om hur de skapade sina samlingar. De beräknade poängen användes sedan som ingångar till en korrespondensanalys och kluster-procedur som möjliggör identifiering av olika segment av samlare.

I den andra artikeln användes IBMs artificiella intelligens-baserade verktyg Watson för att härleda de känslor och stämning som uttrycks i online-recensioner givna av patienter som hade gått igenom en knäbytesoperation. Tillvägagångssättet gav två viktiga insikter: För det första, att de exakta orden från en patient som stod för en poäng som motsvarade en viss känsla eller övergripande stämning lätt kunde spåras tillbaka till den enskilda patienten, och därmed förklara exakt hur och varför patienten uttryckte den specifika känslan eller stämningen. För det andra, att patienterna i det heterogena urvalet kunde fördelas till mer homogena grupper, eller marknadssegment, baserat på deras känslor och stämning. Detta skulle göra det möjligt för marknadsförare att rikta behandlings- och kommunikationsstrategier mer specifikt för olika grupper.

I det tredje artikeln användes DICTION, ett ordlistebaserat automatiserat textanalysverktyg, för att från ett erfarenhetsbaserat perspektiv att studera online-recensioner av turistboende av ett mycket stort urval av resekunder under en tidsperiod. Två viktiga resultat uppstod: För det första finns det starka och betydande belägg för att betygsinflationen över tid ökar, dvs att de genomsnittliga betyg som kunderna beviljat över tid har blivit högre, vilket antyder att dessa betyg kan vara mindre värdefulla som ett beslutsverktyg för andra kunder i framtiden. För det andra fanns det väsentliga skillnader i DICTION-dimensionerna mellan kunder som hade bott hos "professionella" logileverantörer (traditionella märkeshotell) och de som bodde hos "amatör"-leverantörer (lägenhetsuthyrning).

I det fjärde artikeln användes LIWC, ett ordlistebaserat automatiserat verktyg för textanalys från ett skapandebaserat perspektiv för att studera skillnaderna mellan inflytelserika manliga och kvinnliga marknadsföringschefer med titeln Chief Marketing Officers (CMO) i deras online-intervjuer. Det visade sig att manliga CMOer talar med betydligt mer så kallad "clout" - de uttrycker mer status och auktoritet. Kvinnliga CMOer är å andra sidan mer autentiska - de uttrycker mer ärlighet och uppriktighet i sitt tal. Det fanns inga signifikanta skillnader mellan könen med avseende på deras inflytande, den ton de talade eller i vilken utsträckning de var analytiska.

Det övergripande bidraget till kunskap är att ge bevis på användbarheten av både artificiell intelligens-baserad och ordlistebaserad automatiserad textanalysverktyg i två grundläggande marknadsföringsfokusaktiviteter, nämligen skapande och upplevelse. De enskilda artiklarna främjar också vår förståelse för användningen av automatiserad textanalys för att studera jämförelser mellan grupper, liksom korrelation mellan egenskaper och sätt att tala inom textexempel.

Avhandlingen är organiserad att börja med en övergripande introduktion till forskningsberättelsen för fyra relaterade publicerade artiklar. Avhandlingens första kapitel introducerar automatiserad textanalys i marknadsföring, redogörelsen för det övergripande forskningsproblemet och identifieringen av fyra forskningsfrågor. Detta följs av ett kapitel om litteraturöversyn, med särskild tonvikt på en bibliografisk översikt av marknadsföringslitteraturen för automatiserad textanalys med hjälp av ett innovativt verktyg för innehållsanalys, VOSViewer. Detta följs av ett kapitel som beskriver den metodik som används i studierna. Det fjärde kapitlet granskar de fyra artiklarna mer detaljerat, erkänner deras begränsningar, identifierar implikationerna för marknadsföringspraxis och föreslår vägar för framtida marknadsföringsforskning. Under kapitel 5 finns de fyra artiklarna i sin helhet. Tre av dessa artiklar har antingen redan publicerats eller accepterats för publicering; den fjärde går nu igenom en andra revision för en tidskrift.

Place, publisher, year, edition, pages
Stockholm: KTH Royal Institute of Technology, 2020. , p. 170
Series
TRITA-ITM-AVL ; 2020:8
Keywords [en]
Automated text analysis, content analysis, artificial intelligence-based tools, dictionary-based tools, marketing focus activity(ies), creation, experience
Keywords [sv]
Automatiserad textanalys, innehållsanalys, artificiella intelligens-baserade verktyg, ordbok-baserade verktyg, marknadsfokusaktivitet(er), skapande, erfarenhet
National Category
Business Administration
Research subject
Industrial Economics and Management
Identifiers
URN: urn:nbn:se:kth:diva-268985ISBN: 978-91-7873-477-1 (print)OAI: oai:DiVA.org:kth-268985DiVA, id: diva2:1400295
Public defence
2020-04-20, Stockholm, 15:00 (English)
Opponent
Supervisors
Available from: 2020-03-20 Created: 2020-02-28 Last updated: 2020-03-20Bibliographically approved
List of papers
1. New Approches to Psychographic Consumer Segmentation: Exploring Fine Art Collectors Using Artificial intelligence, Automated Text Analysis and Correspondence Analysis
Open this publication in new window or tab >>New Approches to Psychographic Consumer Segmentation: Exploring Fine Art Collectors Using Artificial intelligence, Automated Text Analysis and Correspondence Analysis
2020 (English)In: European Journal of Marketing, ISSN 0309-0566, E-ISSN 1758-7123Article in journal (Refereed) Published
Abstract [en]

Purpose – While the motivation for collecting art has received considerable attention in the literature, less is known about the characteristics of the typical art collector. This paper aims to explore these characteristics to develop a typology of art consumers using a mixed method approach over several studies.

Design/methodology/approach – This is achieved by analyzing qualitative data, gathered via semi- structured interviews of art collectors, and quantitatively by means of natural language processing analysis and automated text analysis and using correspondence analysis to analyze and present the results.

Findings – The study’s findings reveal four distinct clusters of art collectors based on their “Big Five” personality traits, as well as uncovering insights into how these types talk about their possessions.

Research limitations/implications – In addition to contributing to the arts marketing literature, the findings provide a more nuanced understanding of consumers that managers can use for market segmentation and target marketing decisions in other markets. The paper also offers a methodological contribution to the literature on correspondence analysis by demonstrating the “doubling” procedure to deal with percentile data.

Practical implications – In addition to contributing to the arts marketing literature, the findings provide a more nuanced understanding of art collectors that managers can use for market segmentation and target marketing decisions. The paper also offers a methodological contribution to the literature on correspondence analysis by demonstrating a non-traditional application of correspondence analysis using the “doubling” procedure. Buyer behavior in the fine art market is not exhaustively studied. By understanding the personality traits of consumers in the art market, sales forces can better provide assistance and product to consumers. Further, understanding the personalities of consumers is better for art retail spaces to better serve consumers.

Originality/value – This paper demonstrates a unique mixed methods approach to analyzing unstructured qualitative data. It shows how text data can be used to identify measurable market segments for which targeted strategies can be developed.

Keywords
Correspondence analysis, Artificial intelligence, Art collectors, Psychographic segmentation, Quantitative analysis of qualitative data, Automated text analysis, Psychographic consumer segmentation
National Category
Economics and Business
Research subject
Business Studies
Identifiers
urn:nbn:se:kth:diva-268969 (URN)10.1108/EJM-01-2019-0083 (DOI)
Note

QC 20200228

Available from: 2020-02-27 Created: 2020-02-27 Last updated: 2020-02-28Bibliographically approved
2. Quantitative insights from online qualitative data: An example from the health care sector
Open this publication in new window or tab >>Quantitative insights from online qualitative data: An example from the health care sector
2018 (English)In: Psychology & Marketing, ISSN 0742-6046, E-ISSN 1520-6793, Vol. 35, no 12, p. 1010-1017Article in journal (Refereed) Published
Abstract [en]

Among the deluge of online data generated by users in the form of text on social media sites, health care reviews are among the most common, and potentially, the most insightful. Patients review and comment on the experiences with procedures as varied as hysterectomies, colonoscopies, and chemotherapy. In their attempts to reduce the uncertainty associated with medical treatments, many patients nowadays also turn to social media, where they rely on the experiences articulated by other patients. In this study, IBM Watson is used to examine how knee replacement patients talk about their emotions and express sentiment through their comments online. Then, a latent class cluster modeling procedure is used to segment these patients into distinct groups, according to their emotions (anger, disgust, fear, happiness, sadness, and surprise), sentiment, and their overall satisfaction with knee replacement surgery. The findings show how qualitative online data can be transformed into quantitative insights regarding underlying market segments, which could then be targeted through different strategies by both marketers and health care practitioners.

Keywords
artificial intelligence, credence goods, health care, latent class (LC) cluster modelling, sentiment analysis
National Category
Economics and Business
Research subject
Business Studies
Identifiers
urn:nbn:se:kth:diva-268973 (URN)10.1002/mar.21152 (DOI)
Note

QC 20200228

Available from: 2020-02-27 Created: 2020-02-27 Last updated: 2020-02-28Bibliographically approved
3. Accommodation eWOM in the Sharing Economy: Automated Text Comparisons from a Large Sample
Open this publication in new window or tab >>Accommodation eWOM in the Sharing Economy: Automated Text Comparisons from a Large Sample
(English)Manuscript (preprint) (Other academic)
Abstract [en]

Across many industries, individuals are increasingly relying on customer ratings and reviews on social media. While customer reviews often provide detailed diagnostic information about experiences, customer ratings often reduce the experience down to a simple number. Moreover, there is evidence to support that customer rating inflation is occurring on social media sites over time, especially in the sharing economy, and especially with regard to travel and tourism experiences. This paper conceptualizes how customer experiences are reduced into customer reviews and further abridged into customer ratings in both the traditional and sharing economy contexts. We propose that customers observe how service providers present themselves as a professional (established chain hotel) or amateur (owner operated vacation rental apartment), and then form different service expectations and perceptions accordingly. We investigate 55,110 customer reviews and ratings of New York City’s accommodation providers and indeed find evidence of rating inflation over the eight years studied.

Keywords
Customer rating inflation, Customer reviews, Sharing economy, Amateur service providers, automated text analysis
National Category
Economics and Business
Research subject
Business Studies
Identifiers
urn:nbn:se:kth:diva-268975 (URN)
Note

QC 20200228

Available from: 2020-02-27 Created: 2020-02-27 Last updated: 2020-02-28Bibliographically approved
4. Gender and the CMO: Do the Differences Make a Difference?
Open this publication in new window or tab >>Gender and the CMO: Do the Differences Make a Difference?
2019 (English)In: Journal of Strategic Marketing, ISSN 0965-254X, E-ISSN 1466-4488Article in journal (Refereed) In press
Abstract [en]

Despite efforts to address the lack of female representation in execu- tive leadership roles, the number of women in leadership roles is still low in comparison to men. Data in the form of online interviews were collected for a sample of 69 CMOs from the World’s Most Influential CMO’s report by Forbes Magazine and analyzed using the automated text analysis software, LIWC, employing the dimensions of Analytic, Clout, Authentic, and Tone. A series of ANOVAs was conducted to determine the impact of gender on these dimensions. Clout and Authentic were significantly impacted by the gender of the CMO. The paper considers two gender communication theories that could potentially explain these differences. The paper concludes by dis- cussing managerial implications, acknowledging the limitations, and identifying avenues for future research.

Place, publisher, year, edition, pages
Taylor & Francis Group, 2019
Keywords
Gender, Chief Marketing Officer, CMO, LIWC
National Category
Economics and Business
Research subject
Business Studies
Identifiers
urn:nbn:se:kth:diva-268971 (URN)10.1080/0965254X.2019.1694567 (DOI)
Note

QC 20200228

Available from: 2020-02-27 Created: 2020-02-27 Last updated: 2020-02-28Bibliographically approved

Open Access in DiVA

Automated Text Analysis of Online Content - Summary Thesis(5118 kB)24 downloads
File information
File name FULLTEXT01.pdfFile size 5118 kBChecksum SHA-512
eb0acb541e6ac981a0da294310f52bdd21760ca25fd1923abd295c030206ce3c7a0fd9df61c9ba7aed1ea3cbc43f007f74867635f14bbd55b38a7958779f3f43
Type fulltextMimetype application/pdf

Authority records BETA

Pitt, Christine

Search in DiVA

By author/editor
Pitt, Christine
By organisation
Industrial Economics and Management (Dept.)
Business Administration

Search outside of DiVA

GoogleGoogle Scholar
Total: 24 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

isbn
urn-nbn

Altmetric score

isbn
urn-nbn
Total: 106 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf