Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Methodology for Linked Enterprise Data Quality Assessment Through Information Visualizations
KTH, School of Industrial Engineering and Management (ITM), Machine Design (Dept.), Mechatronics. (Model-based engineering methodology and integrated engineering environments)ORCID iD: 0000-0002-8853-4159
KTH, School of Industrial Engineering and Management (ITM), Machine Design (Dept.), Mechatronics.ORCID iD: 0000-0002-0889-5190
2018 (English)In: Journal of Industrial Information Integration, ISSN 2452-414XArticle in journal (Refereed) Published
Abstract [en]

Today’s development environments in the manufacturing industry require different development tools to work together. These complex environments are highly heterogeneous and constantly changing, and the development tools are producing a huge amount of data. As a result, these development environments must overcome a significant problem related to data integration. In this paper, we examine a case study from the automotive industry using the linked enterprise data approach to integrate data from different development tools. The study explains and applies a data quality assessment methodology as a post-integration phase for linked enterprise data. 

In this study, important data quality dimensions from the literature are merged with empirical rules that have been defined by Scania CV AB employees. As a result, a comprehensive methodology is developed and introduced to assess these data quality dimensions. This paper presents the methodology, which aims to develop a data quality assessment tool—a dashboard—in addition to policies and protocols to manage data quality. Moreover, the proposed methodology includes systematic guidelines for planning the data quality assessment activity, extracting requirements for the data quality management, setting priorities to expedite the adaptation, identifying dimensions and metrics to ease the understanding, and visualizing these dimensions and metrics to assess the overall data quality.

Place, publisher, year, edition, pages
Elsevier, 2018.
Keywords [en]
data quality, linked data, quality assessment, linked enterprise data, information visualization, methodology
National Category
Computer and Information Sciences Embedded Systems
Research subject
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-232357DOI: 10.1016/j.jii.2018.11.002OAI: oai:DiVA.org:kth-232357DiVA, id: diva2:1233949
Note

QC 20180822

Available from: 2018-07-20 Created: 2018-07-20 Last updated: 2019-01-11Bibliographically approved
In thesis
1. Data and Visual Analytics for Cyber-physical Systems: Current Situation and Strategies for Action
Open this publication in new window or tab >>Data and Visual Analytics for Cyber-physical Systems: Current Situation and Strategies for Action
2018 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]

Today, cyber-physical systems (CPS) exist everywhere in different sizes, with different functionalities and capabilities. CPS often support critical missions that have significant economic and societal importance. They require software systems, communications technologies, sensors/actuators, embedded technologies, and physical systems to work together seamlessly, and they are seen as a driving force behind digital transformation. This dissertation describes the research work carried out to investigate applicability of data and visual analytics for CPS to overcome three main challenges: interoperability, complexity, and sustainability.

To this end, several case studies are used to effectively implement and test different data and visual analytics solutions to aid stakeholders when they make decisions on interoperability, complexity, and sustainability for CPS. These studies raised questions about issues found to be of importance for the success of data and visual analytics approaches, including accessibility, availability, quality, volume, and variety of data—issues. Moreover, additional studies are used to show the benefits of blending different approaches, such as systems thinking and design thinking, and the current data analytics readiness of the Swedish industry is assessed through a questionnaire completed by more than a hundred respondents. 

The data and visual analytics are positioned between digitalization and machine intelligence as a research focus. Data and visual analytics is the next step after digitalizing the information by adding analytical capabilities to the data. It is also an important phase before developing machine intelligence applications. Earlier studies clearly show that only a fraction of companies have machine intelligence applications across the enterprise. One important reason behind this is the lack of strong digital capabilities that big data and advanced data analytics technologies could bring. The findings of the work carried out as part of this thesis show the importance of this middle phase—data and visual analytics—for the success of not only the CPS but also these two concepts—digitalization and machine intelligence.

This thesis concludes by highlighting that currentdata and visual analytics approaches in CPS are closely dependent onthe availability, accessibility, quality, volume, and variety of the data. Notably, the huge amount of industrial data that exists in CPS manufacturers data repositories does not always mean that this data is useful, especially for analytical purposes. To this end, firstly, the CPS industry should concentrate its efforts to collect useful data that will benefit the industry by providing analytical insight intothe environments where CPS is produced and operated. Secondly, the industry should make necessary organizational changes such as considering to employ data scientists, analysts, and business intelligence developers and make data accessible tothese people for further usage. Thirdly, the data management procedures and data analytics roadmaps of companies should be created and shared with other employees, and necessary mechanisms needto be considered to improve and guarantee the quality of the data. Lastly, the variety of data needs to be addressed by the industry. 

Data and visual analytics provides an opportunity to extract patterns; to evaluate the interoperability, complexity, and sustainability; to create an overview of the current challenge by providing different viewpoints adapted to different stakeholders, focusing on key concerns for the respective stakeholder; to optimize performance, automation, and cooperation of distributed CPS, development environment, and teams; and overall, to improve any of the challenges that are mentioned above by, basically, providing a better understanding.

To this end, I suggest that the industry discuss the next step after digitalization and address the challenges related to the availability, accessibility, quality, volume, and variety of data by considering user-centric approaches and organizational needs of the future development and manufacturing environments. The CPS industry should plan and act on these challenges as part of its data analytics strategies to expedite the machine intelligence applications of the future.

Abstract [sv]

Idag finns cyber-fysiska system (CPS) överallt i olika storlekar, med olika funktioner och kapaciteter. CPS stöder ofta uppdrag av betydande ekonomisk och samhällelig vikt. De kräver mjukvarusystem, kommunikationsteknik, sensorer, inbyggd teknik och fysiska system för att fungera sömlöst och de ses som en drivkraft bakom digital transformation. Denna avhandling sammanfattar det arbete som gjorts för att förstå hur data och visuell analys kan tillämpas så att CPS kan övervinna de tre huvudutmaningarna: interoperabilitet, komplexitet och hållbarhet.

För detta ändamål används flera fallstudier som ett effektivt sätt att implementera och testa olika data- och visuella analyslösningar för att hjälpa intressenter när de fattar beslut om interoperabilitet, komplexitet och hållbarhet gällande CPS. Dessa studier har väckt frågor som visat sig vara viktiga för framgången för  data- och visuella analysmetoder vad gäller tillgång, åtkomst, kvalitet, volym och mängd avseende data. Vidare används ytterligare studier för att visa fördelarna med att blanda olika tillvägagångssätt som systemtänkande och designtänkande, och den svenska industrins nuvarande dataanalysberedskap utvärderas genom ett frågeformulär som har besvarats av mer än hundra respondenter.

Data- och visuella analyser är som forskningsfokus placerade mellan digitalisering och maskinintelligens. Data och visuell analys ses som nästa steg efter digitalisering av informationen genom att lägga till analytiska möjligheter till tillgänglig data. Det är också en viktig fas innan utveckling av maskinintelligens kan ske. Tidigare studier visar tydligt att endast en bråkdel av undersökta företag använder maskinintelligens i större skala. En viktig orsak bakom detta är bristen på kraftfulla digitala kapaciteter som avancerad teknik som stor data och dataanalysteknik skulle kunna ge. Resultaten av det arbete som skett inom ramen för denna avhandling visar vikten av denna mellanfas - data- och visuell analys - för inte bara framgången för CPS utan också framgången för dessa två begrepp-digitalisering och maskinintelligens.

Avhandlingen avslutades genom att betona att nuvarande data- och visuella analysmetoder i CPS är beroende av tillgång, åtkomst, kvalitet, volym och mängd av data. Det är viktigt att påminna om att den enorma mängd industriell data som finns i CPS-tillverkarnas datalager inte alltid betyder att dessa data är användbara, särskilt för analytiska ändamål. För detta ändamål bör CPS-industrin i första hand rikta in sig på att samla in användbar data som kommer att gynna dem genom att ge analytisk inblick i de miljöer där CPS produceras och drivs. För det andra bör industrin göra nödvändiga organisatoriska förändringar som att anställa datatekniker, analytiker och affärsintelligensutvecklare samt göra relevant data tillgänglig för vidare användning av dessa personer. För det tredje bör industrin skapa databehandlingsförfaranden och dataanalysfärdplaner som kan delas med andra anställda och nödvändiga mekanismer måste utformas för att förbättra och garantera datans kvalitet. Slutligen måste industrin uppmärksamma mångfalden av data.

Data och visuell analys ger möjligheter att upptäcka mönster; att utvärdera interoperabilitet, hållbarhet och komplexitet; att skapa en överblick över den aktuella utmaningen genom att ge olika intressenter olika anpassade synpunkter och fokusera på viktiga frågeställningar för respektive intressent; att optimera prestanda, automatisering och samarbete av distribuerade CPS, utvecklingsmiljöer och arbetsgrupper; och sammantaget, att förbättra de utmaningar som nämns ovan genom att i grund och botten ge en bättre förståelse.

För detta ändamål föreslår jag att industrin diskuterar nästa steg efter digitaliseringen och tar itu med utmaningarna som finns avseende tillgång, åtkomst, kvalitet, volym och mängd av data genom att undersöka användarcentrerade tillvägagångssätt och organisatoriska behov i framtida utvecklings- och tillverkningsmiljöer. CPS-industrin bör planera och agera på dessa utmaningar som en del av deras dataanalysstrategier för att påskynda framtida användningsområden för maskinintelligens.

Place, publisher, year, edition, pages
Stockholm: KTH Royal Institute of Technology, 2018. p. 57
Series
TRITA-ITM-AVL ; 2018:50
National Category
Mechanical Engineering
Research subject
Machine Design
Identifiers
urn:nbn:se:kth:diva-239575 (URN)978-91-7729-974-5 (ISBN)
Public defence
2019-01-25, Kollegiesalen, Brinellvägen 8, Stockholm, 13:00 (English)
Opponent
Supervisors
Note

QC 20190111

Available from: 2018-12-12 Created: 2018-11-27 Last updated: 2019-01-11Bibliographically approved

Open Access in DiVA

fulltext(1431 kB)20 downloads
File information
File name FULLTEXT01.pdfFile size 1431 kBChecksum SHA-512
16d4dfa8439a091792187d79c06ccf48d7a2db2afd0f0029f4a47b6237aa92c71ca11720544f8f1c33a4ed0c113823b622dc108d2f6b4df0f59c3826ab283d7f
Type fulltextMimetype application/pdf

Other links

Publisher's full textPublisher

Authority records BETA

El-khoury, Jad

Search in DiVA

By author/editor
Gürdür, DidemEl-khoury, Jad
By organisation
Mechatronics
Computer and Information SciencesEmbedded Systems

Search outside of DiVA

GoogleGoogle Scholar
Total: 20 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

doi
urn-nbn

Altmetric score

doi
urn-nbn
Total: 122 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf