Ändra sökning
Avgränsa sökresultatet
123456 151 - 200 av 287
RefereraExporteraLänk till träfflistan
Permanent länk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Träffar per sida
  • 5
  • 10
  • 20
  • 50
  • 100
  • 250
Sortering
  • Standard (Relevans)
  • Författare A-Ö
  • Författare Ö-A
  • Titel A-Ö
  • Titel Ö-A
  • Publikationstyp A-Ö
  • Publikationstyp Ö-A
  • Äldst först
  • Nyast först
  • Skapad (Äldst först)
  • Skapad (Nyast först)
  • Senast uppdaterad (Äldst först)
  • Senast uppdaterad (Nyast först)
  • Disputationsdatum (tidigaste först)
  • Disputationsdatum (senaste först)
  • Standard (Relevans)
  • Författare A-Ö
  • Författare Ö-A
  • Titel A-Ö
  • Titel Ö-A
  • Publikationstyp A-Ö
  • Publikationstyp Ö-A
  • Äldst först
  • Nyast först
  • Skapad (Äldst först)
  • Skapad (Nyast först)
  • Senast uppdaterad (Äldst först)
  • Senast uppdaterad (Nyast först)
  • Disputationsdatum (tidigaste först)
  • Disputationsdatum (senaste först)
Markera
Maxantalet träffar du kan exportera från sökgränssnittet är 250. Vid större uttag använd dig av utsökningar.
  • 151. Lin, Q.
    et al.
    Xia, K.
    Wang, Lihui
    KTH, Skolan för industriell teknik och management (ITM), Industriell produktion.
    Gao, L.
    Cloud manufacturing in China: A literature survey2014Ingår i: International Journal of Manufacturing Research, ISSN 1750-0591, Vol. 9, nr 4, s. 369-388Artikel i tidskrift (Refereegranskat)
    Abstract [en]

    Cloud manufacturing has been of considerable interest to Chinese academic researchers over the last decade. This paper presents a broad perspective of the research on cloud manufacturing in China. The topics studied mainly include design of cloud manufacturing architecture, resource and capability virtualisation, combinatorial optimisation of virtual resource and capability, design and collaboration of cloud manufacturing services, intelligent searching and matching methods and trust evaluation. The present literature survey also includes two successful cases applying cloud manufacturing in China to verify the feasibility of the cloud manufacturing architecture and services. Potentially interesting directions for future research in this area are also identified.

  • 152.
    Lin, Rui
    et al.
    KTH, Skolan för elektroteknik och datavetenskap (EECS), Kommunikationssystem, CoS, Optical Network Laboratory (ON Lab).
    Pang, Xiaodan
    KTH, Skolan för elektroteknik och datavetenskap (EECS), Kommunikationssystem, CoS, Optical Network Laboratory (ON Lab).
    Van Kerrebrouck, J.
    Belgium.
    Verplaetse, M.
    Belgium.
    Ozolins, O.
    Udalcovs, A.
    Zhang, Lu
    KTH, Skolan för elektroteknik och datavetenskap (EECS), Kommunikationssystem, CoS, Optical Network Laboratory (ON Lab).
    Gan, L.
    China.
    Tang, M.
    China.
    Fu, S.
    China.
    Schatz, Richard
    KTH, Skolan för teknikvetenskap (SCI), Tillämpad fysik, Fotonik.
    Westergren, Urban
    KTH, Skolan för teknikvetenskap (SCI), Tillämpad fysik, Fotonik.
    Popov, Sergei
    KTH, Skolan för teknikvetenskap (SCI), Tillämpad fysik, Fotonik.
    Liu, D.
    China.
    Tong, W.
    China.
    De Keulenaer, T.
    Belgium.
    Torfs, G.
    Belgium.
    Bauwelinck, J.
    Belgium.
    Yin, X.
    Belgium.
    Chen, Jiajia
    KTH, Skolan för elektroteknik och datavetenskap (EECS), Kommunikationssystem, CoS, Optical Network Laboratory (ON Lab).
    Real-time 100 Gbps/λ/core NRZ and EDB IM/DD transmission over 10 km multicore fiber2018Ingår i: Optics InfoBase Conference Papers, Optical Society of America, 2018Konferensbidrag (Refereegranskat)
    Abstract [en]

    A BiCMOS chip-based real-time IM/DD spatial division multiplexing system is experimentally demonstrated for short-reach communications. 100 Gbps/λ/core NRZ and EDB transmission is achieved below 7%-overhead HD-FEC limit after 10km 7-core fiber with optical dispersion compensation.

  • 153.
    Lindblom, Marcus
    et al.
    KTH, Skolan för kemi, bioteknologi och hälsa (CBH), Medicinteknik och hälsosystem, Hälsoinformatik och logistik.
    Åhlin, Robin
    KTH, Skolan för kemi, bioteknologi och hälsa (CBH), Medicinteknik och hälsosystem, Hälsoinformatik och logistik.
    Medical counselling via video using WebRTC: User interface and user experience design2019Självständigt arbete på grundnivå (högskoleexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
    Abstract [sv]

    CareLigo är ett medicintekniskt företag som tillhandahåller hjärtsviktspatienter med en hembaserad vårdlösning kallad OPTILOGG. OPTILOGG hjälper patienter att hålla koll på deras symptom, ger medicineringsanvisningar och utbildar dem om sin sjukdom. CareLigo eftersökte en utökning av OPTILOGG vilket skulle ge patienterna möjlighet att prata med vårdgivare via videokommunikation.

    Detta examensarbete beskriver skapandet av denna videokommunikationslösning och hur detta kan göras på bästa sätt för både patienter och vårdgivare. Utifrån litteraturstudier gällande människa-dator-interaktion samt användargränssnitts (UI)-och interaktionsdesign (UX) utvecklades en fristående Androidapplikation för vårdgivare och en utökning i OPTILOGG med hänsyn tagen till att användarna av OPTILOGG ofta är multisjuka och äldre. Tre tillgänglighetshjälpmedel tillades i utökningen av OPTILOGG. Det första hjälpmedlet var en förstoring av klickareor runt knappar. Den andra tillgänglighetsåtgärden var en skärmläsarfunktion som beskriver objekt som användaren klickar på. Det tredje verktyget var en funktion för taligenkänning som gjorde det möjligt för patienter att navigera i OPTILOGG med röst. Videokommunikationen mellan den fristående vårdgivarapplikationen och OPTILOGG baserades på WebRTC och utvecklades med hjälp av ett utvecklingsverktyg från en molnkommunikationsle-verantör som heter Sinch.

    Ladda ner fulltext (pdf)
    fulltext
  • 154.
    Liu, Lizheng
    et al.
    Fudan Univ, State Key Lab ASIC & Syst, Shanghai 200433, Peoples R China..
    Jin, Yi
    Fudan Univ, State Key Lab ASIC & Syst, Shanghai 200433, Peoples R China..
    Liu, Yi
    Fudan Univ, State Key Lab ASIC & Syst, Shanghai 200433, Peoples R China..
    Ma, Ning
    KTH, Skolan för informations- och kommunikationsteknik (ICT).
    Huan, Yuxiang
    KTH, Skolan för informations- och kommunikationsteknik (ICT).
    Zou, Zhuo
    Fudan Univ, State Key Lab ASIC & Syst, Shanghai 200433, Peoples R China..
    Zheng, Lirong
    Fudan Univ, State Key Lab ASIC & Syst, Shanghai 200433, Peoples R China.;KTH Royal Inst Technol, Sch Informat & Commun Technol, S-16440 Kista, Sweden..
    A Design of Autonomous Error-Tolerant Architectures for Massively Parallel Computing2018Ingår i: IEEE Transactions on Very Large Scale Integration (vlsi) Systems, ISSN 1063-8210, E-ISSN 1557-9999, Vol. 26, nr 10, s. 2143-2154Artikel i tidskrift (Refereegranskat)
    Abstract [en]

    The massively parallel computing systems composed of many processors are connected on chips, which will become more and more complex and unreliable. This paper presents an error-tolerant design based on the autonomous error-tolerant (AET) architecture that aims to have a self-repairing capability. A nearby error sensing mechanism is designed to discover faults, and an active evolution scheme is studied to handle unrecoverable errors. A circuit backup switching mechanism is proposed to bypass the failed nodes. The board-level prototype is implemented based on dual-core embedded processors. The analysis shows that the error-tolerant capability of the proposed architecture is better than the conventional multimodular redundant system when the failure rate of a single core is less than 0.7. In the AET test system consisting of 16 processors, the error-tolerant capability is verified. The results show that the relative variation of the overall performance of the AET system will not be changed due to the high reliability requirements of the system. Through experimental comparison, under the premise that the architecture of AET and the triple modular redundancy method are basically consistent in reliability, whether on the logical-level error tolerant or on the physical-level error tolerant, the former has lower power consumption.

  • 155.
    Liu, Ming
    et al.
    KTH, Skolan för informations- och kommunikationsteknik (ICT).
    Dubrova, Elena
    KTH, Skolan för informations- och kommunikationsteknik (ICT).
    An New Approach to Reliable FSRs Design2014Ingår i: 2014 NORCHIP / [ed] Nurmi, J Daniel, O Liljeberg, P Rahkonen, T Nielsen, IR, IEEE , 2014Konferensbidrag (Refereegranskat)
    Abstract [en]

    Since the invention of integrated circuits in 1950s, the great budget of reliability of semiconductors have prompted the 60 years of glory of electrical industry. However, as the technology shrinks in recent years, the continuing rising of circuit density and the reduction of device sizes cause a lot of new constrains and problems, such as high power consumption and leakage currents in nano-meter designs. One of the serious consequences of these changes is the reduction of circuit reliability. In this paper, we introduce a new method for correcting transient faults in Feedback Shift Registers (FSRs) based on duplication and parity checking. The presented method is more reliable than Triple Model Redundancy (TMR) for large FSRs, while the area overhead of the two approaches is comparable. The presented approach might be important for applications using large FSRs, e.g. cryptography.

  • 156.
    Liu, Shaoteng
    et al.
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Elektronik och Inbyggda System.
    Axel, Jantsch
    TU Wien, Vienna, Austria.
    Lu, Zhonghai
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Elektronik och Inbyggda System.
    MultiCS: Circuit switched NoC with multiple sub-networks and sub-channels2015Ingår i: Journal of systems architecture, ISSN 1383-7621, E-ISSN 1873-6165Artikel i tidskrift (Refereegranskat)
    Abstract [en]

    We propose a multi-channel and multi-network circuit switched NoC (MultiCS) with a probe searching setup method to explore different channel partitioning and configuration policies. Our design has a variable number of channels which can be configured either as sub-channels (spatial division multiplexing channels) or sub-networks. Packets can be delivered on an established connection with one or multiple channels. An adaptive channel allocation scheme, which determines a connection width according to the dynamic use of channels, can greatly reduce the delay, compared to a deterministic allocation scheme. However, the latter can offer exact connection width as requested. The benefits and burden of using different number of channels and configurations are studied by analysis and experiments. Our experimental results show that sub-network configurations are superior to sub-channel configurations in delay and throughput, when working at the highest clock frequency of each configuration. Under reasonable channel partitioning, sub-networks with narrow channels can generally achieve higher throughput than the network using single wide channels.

  • 157.
    Liu, Ying
    et al.
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Programvaruteknik och Datorsystem, SCS.
    Guan, Xi
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Programvaruteknik och Datorsystem, SCS.
    Vlassov, Vladimir
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Programvaruteknik och Datorsystem, SCS.
    Haridi, Seif
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Programvaruteknik och Datorsystem, SCS.
    MeteorShower: Minimizing Request Latency for Majority Quorum-Based Data Consistency Algorithms in Multiple Data Centers2017Ingår i: 2017 IEEE 37th International Conference on Distributed Computing Systems (ICDCS), Institute of Electrical and Electronics Engineers (IEEE), 2017, s. 57-67, artikel-id 7979955Konferensbidrag (Refereegranskat)
    Abstract [en]

    With the increasing popularity of serving and storing data in multiple data centers, we investigate the efficiency of majority quorum-based data consistency algorithms under this scenario. Because of the failure-prone nature of distributed storage systems, majority quorum-based data consistency algorithms become one of the most widely adopted approaches. In this paper, we propose the MeteorShower framework, which provides fault-tolerant read/write key-value storage service across multiple data centers with sequential consistency guarantees. A major feature is that most read operations are executed locally within a single data center. This results in lowering read latency from hundreds of milliseconds to tens of milliseconds. The data consistency algorithm in MeteorShower augments majority quorum-based algorithms. Thus, it keeps all the desirable properties of majority quorums, such as fault tolerance, balanced load, etc. An implementation of MeteorShower on top of Cassandra is deployed and evaluated in multiple data centers using the Google Cloud Platform. Evaluations of MeteorShower framework have shown that it can consistently serve read requests without paying the communication delays among replicas maintained in multiple data centers. As a result, we are able to improve the latency of read requests from hundreds of milliseconds to tens of milliseconds while achieving the same latency on write requests and the same fault tolerance guarantee. Thus, MeteorShower is optimized for read intensive workloads.

  • 158. Loni, M.
    et al.
    Majd, A.
    Loni, A.
    Daneshtalab, M.
    Sjödin, M.
    Troubitsyna, Elena
    KTH, Skolan för elektroteknik och datavetenskap (EECS).
    Designing compact convolutional neural network for embedded stereo vision systems2018Ingår i: Proceedings - 2018 IEEE 12th International Symposium on Embedded Multicore/Many-Core Systems-on-Chip, MCSoC 2018, Institute of Electrical and Electronics Engineers (IEEE), 2018, s. 244-251, artikel-id 8540240Konferensbidrag (Refereegranskat)
    Abstract [en]

    Autonomous systems are used in a wide range of domains from indoor utensils to autonomous robot surgeries and self-driving cars. Stereo vision cameras probably are the most flexible sensing way in these systems since they can extract depth, luminance, color, and shape information. However, stereo vision based applications suffer from huge image sizes and computational complexity leading system to higher power consumption. To tackle these challenges, in the first step, GIMME2 stereo vision system [1] is employed. GIMME2 is a high-throughput and cost efficient FPGA-based stereo vision embedded system. In the next step, we present a framework for designing an optimized Deep Convolutional Neural Network (DCNN) for time constraint applications and/or limited resource budget platforms. Our framework tries to automatically generate a highly robust DCNN architecture for image data receiving from stereo vision cameras. Our proposed framework takes advantage of a multi-objective evolutionary optimization approach to design a near-optimal network architecture for both the accuracy and network size objectives. Unlike recent works aiming to generate a highly accurate network, we also considered the network size parameters to build a highly compact architecture. After designing a robust network, our proposed framework maps generated network on a multi/many core heterogeneous System-on-Chip (SoC). In addition, we have integrated our framework to the GIMME2 processing pipeline such that it can also estimate the distance of detected objects. The generated network by our framework offers up to 24x compression rate while losing only 5% accuracy compare to the best result on the CIFAR-10 dataset.

  • 159.
    Lundmark, Magnus
    et al.
    KTH, Skolan för teknik och hälsa (STH), Medicinsk teknik, Data- och elektroteknik.
    Dahlman, Carl-Johan
    KTH, Skolan för teknik och hälsa (STH), Medicinsk teknik, Data- och elektroteknik.
    Differential privacy and machine learning: Calculating sensitivity with generated data sets2017Självständigt arbete på grundnivå (högskoleexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
    Abstract [sv]

    Aldrig tidigare har integritet varit viktigare att upprätthålla än i dagens informationssamhälle, där företag och organisationer samlar stora mängder data om sina användare. Merparten av denna information är sedd som värdefull och kan användas för att skapa statistik som i sin tur kan ge insikt inom områden som medicin, ekonomi eller beteendemönster bland individer.

    För att säkerställa att en enskild individs integritet upprätthålls har en teknik som heter differential privacy utvecklats. Denna möjliggör framtagandet av användbar statistik samtidigt som individens integritet upprätthålls. Differential privacy har dock en nackdel, och det är storleken på det randomiserade bruset som används för att dölja individen i en fråga om data.

    Denna undersökning undersökte huruvida detta brus kunde förbättras genom att använda maskininlärning för att generera ett data set som bruset kunde baseras på. Tanken var att den genererade datasetet skulle kunna ge en lokal representation av det underliggande datasetet som skulle vara säker att använda vid beräkning av det randomiserade brusets storlek. Forskningen visar att detta tillvägagångssätt för närvarande inte stöds av resultaten. Storleken på det beräknade bruset var inte tillräckligt stort och resulterade därmed i en oacceptabel mängd läckt information.

    Forskningen visar emellertid att genom att begränsa bruset till en lägsta nivå som är beräknad från det lokala datasetet möjligtvis kan räcka för att uppfylla alla sekretesskrav. Ytterligare forskning behövs för att säkerställa att detta ger den nödvändiga nivån av integritet. Vidare undersöktes inte noggrannheten hos maskininlärningsalgoritmen och dess inverkan på brusets användbarhet vilket kan vara en inriktning för vidare studier. 

    Ladda ner fulltext (pdf)
    fulltext
  • 160.
    Lundström, Anders
    et al.
    KTH, Skolan för datavetenskap och kommunikation (CSC), Medieteknik och interaktionsdesign, MID.
    Pargman, Daniel
    KTH, Skolan för datavetenskap och kommunikation (CSC), Medieteknik och interaktionsdesign, MID. Skolan för datavetenskap och kommunikation (CSC), Centra, KTH, Skolan för arkitektur och samhällsbyggnad (ABE), Centra, Centre for Sustainable Communications, CESC.
    Developing a framework for evaluating the sustainability of computing projects2017Ingår i: LIMITS 2017 - Proceedings of the 2017 Workshop on Computing Within Limits, Association for Computing Machinery, Inc , 2017, s. 111-117Konferensbidrag (Refereegranskat)
    Abstract [en]

    Toyama [19] has proposed a "preliminary taxonomy" for classifying computing projects as a way of separating sustainable computing efforts from unsustainable ones. In this paper we explore the feasibility of Toyama's taxonomy. We begin by describing how we revised and developed his taxonomy to make it more practically useful and then conducted a pilot study where we used the revised version to evaluate four computing projects. The pilot study was then used as a foundation for further discussing and developing the revised taxonomy into yet another, third and final version which we have chosen to call the Sustainable Computing Evaluation Framework (SCEF). While our proposed framework (SCEF) is more practically useful than Toyama's "preliminary taxonomy", there are still challenges that need to be addressed and we end the paper by suggesting where future efforts could be focused.

  • 161.
    Ma, Ruixiang
    et al.
    Huazhong Univ Sci & Technol, Wuhan Natl Lab Optoelect, Wuhan 430074, Hubei, Peoples R China..
    Wu, Fei
    Huazhong Univ Sci & Technol, Wuhan Natl Lab Optoelect, Wuhan 430074, Hubei, Peoples R China.;Huazhong Univ Sci & Technol, Shenzhen Res Inst, Shenzhen 518000, Peoples R China..
    Zhang, Meng
    Huazhong Univ Sci & Technol, Wuhan Natl Lab Optoelect, Wuhan 430074, Hubei, Peoples R China..
    Lu, Zhonghai
    KTH, Skolan för elektroteknik och datavetenskap (EECS), Elektronik, Elektronik och inbyggda system.
    Wan, Jiguang
    Huazhong Univ Sci & Technol, Wuhan Natl Lab Optoelect, Wuhan 430074, Hubei, Peoples R China..
    Xie, Changsheng
    Huazhong Univ Sci & Technol, Wuhan Natl Lab Optoelect, Wuhan 430074, Hubei, Peoples R China.;Huazhong Univ Sci & Technol, Shenzhen Res Inst, Shenzhen 518000, Peoples R China..
    RBER-Aware Lifetime Prediction Scheme for 3D-TLC NAND Flash Memory2019Ingår i: IEEE Access, E-ISSN 2169-3536, Vol. 7, s. 44696-44708Artikel i tidskrift (Refereegranskat)
    Abstract [en]

    NAND flash memory is widely used in various computing systems. However, flash blocks can sustain only a limited number of program/erase (P/E) cycles, which are referred to as the endurance. On one hand, in order to ensure data integrity, flash manufacturers often define the maximum P/E cycles of the worst block as the endurance of flash blocks. On the other hand, blocks exhibit large endurance variations, which introduce two serious problems. The first problem is that the error correcting code (ECC) is often over-provisioned, as it has to be designed to tolerate the worst case to ensure data integrity, which causes longer decoding latency. The second problem is the underutilized block's lifespan due to conservatively defined block endurance. Raw bit error rate (RBER) of most blocks have not arrived the allowable RBER based on the nominal endurance point, which implies that the conventional P/E cycle-based block retirement policies may waste large flash storage space. In this paper, to exploit the storage capacity of each flash block, we propose an RBER-aware lifetime prediction scheme based on machine learning technologies. We consider the problem that the model can lose prediction effectiveness over time and use incremental learning to update the model for adapting the changes at different lifetime stages. At run time, trained data will be gradually discarded, which can reduce memory overhead. For evaluating our purpose, four well-known machine learning techniques have been compared in terms of predictive accuracy and time overhead under our proposed lifetime prediction scheme. We also compared the predicted values with the tested values obtained in the real NAND flash-based test platform, and the experimental results show that the support vector machine (SVM) models based on our proposed lifetime prediction scheme can achieve as high as 95% accuracy for flash blocks. We also apply our proposed lifetime prediction scheme to predict the actual endurance of flash blocks at four different retention times, and the experimental results show that it can significantly improve the maximum P/E cycle of flash blocks from 37.5% to 86.3% on average. Therefore, the proposed lifetime prediction scheme can provide a guide for block endurance prediction.

  • 162.
    Maan, Narbir Singh
    et al.
    KTH, Skolan för teknik och hälsa (STH), Medicinsk teknik, Data- och elektroteknik.
    Hanchi, Hamza
    KTH, Skolan för teknik och hälsa (STH), Medicinsk teknik, Data- och elektroteknik.
    Secure Access for Public Clients to Web API:s with Minimum Performance Loss2014Självständigt arbete på grundnivå (högskoleexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
    Abstract [sv]

    Mycket information finns numera tillgänglig via Web API:er på Internet och utan säkerhet och kryptering är det mycket lätt att illvilliga personer får tillgång till konfidentiellinformation.

    Målet är att ta reda på vilka olika säkerhetsmekanismer som finns tillgängliga för att tillhandahålla en säker kommunikation med ett Web API från webbklienter och mobila applikationer med så liten påverkan på prestanda. Kunskapsinhämtning, utveckling och underhållandet av lösningar är också viktiga aspeketer som tittats på vid utvärderingen av mekanismerna.

    Flera mekanismer finns att använda sig av för att säkra kommunkationen men de lämpliga mekanismerna för publika klienter är Digest Authentication och OAuth 2.0. De utvalda mekanismerna har utvecklats, testats, utvärderats med avseende på säkerhet, påverkan på prestanda och användbarhet utifrån ett företags perspektiv.

    Autentiserings- och behörighets-mekanismen som blev den utvalda var OAuth 2.0 då den har minst påverkan på prestandan och bättre säkerhets egenskaper än de andra mekanismerna.

    Ladda ner fulltext (pdf)
    Secure Access for Public Clients to Web APIs with Minimum Performance Loss
  • 163. Macellari, Luca
    et al.
    Karayiannidis, Yiannis
    KTH, Skolan för datavetenskap och kommunikation (CSC), Robotik, perception och lärande, RPL.
    Dimarogonas, Dimos V.
    KTH, Skolan för elektro- och systemteknik (EES), Reglerteknik.
    Multi-Agent Second Order Average Consensus With Prescribed Transient Behavior2017Ingår i: IEEE Transactions on Automatic Control, ISSN 0018-9286, E-ISSN 1558-2523, Vol. 62, nr 10, s. 5282-5288Artikel i tidskrift (Refereegranskat)
  • 164.
    Majd, Amin
    et al.
    Abo Akad Univ, Turku, Finland..
    Daneshtalab, Masoud
    Malardalen Univ, Vasteras, Sweden..
    Plosila, Juha
    Univ Turku, Turku, Finland..
    Moghaddami Khalilzad, Nima
    KTH.
    Sahebi, Golnaz
    Univ Turku, Turku, Finland..
    Troubitsyna, Elena
    Abo Akad Univ, Turku, Finland..
    NOMeS: Near-Optimal Metaheuristic Scheduling for MPSoCs2017Ingår i: 2017 19TH INTERNATIONAL SYMPOSIUM ON COMPUTER ARCHITECTURE AND DIGITAL SYSTEMS (CADS), IEEE , 2017, s. 70-75Konferensbidrag (Refereegranskat)
    Abstract [en]

    The task scheduling problem for Multiprocessor System-on-Chips (MPSoC), which plays a vital role in performance, is an NP-hard problem. Exploring the whole search space in order to find the optimal solution is not time efficient, thus metaheuristics are mostly used to find a near-optimal solution in a reasonable amount of time. We propose a novel metaheuristic method for near-optimal scheduling that can provide performance guarantees for multiple applications implemented on a shared platform. Applications are represented as directed acyclic task graphs (DAG) and are executed on an MPSoC platform with given communication costs. We introduce a novel multi-population method inspired by both genetic and imperialist competitive algorithms. It is specialized for the scheduling problem with the goal to improve the convergence policy and selection pressure. The potential of the approach is demonstrated by experiments using a Sobel filter, a SUSAN filter, RASTA-PLP and JPEG encoder as real-world case studies.

  • 165.
    Mathew, Jimson
    KTH, Tidigare Institutioner, Mikroelektronik och informationsteknik, IMIT.
    Design and evaluation of fault tolerant VLSI architectures2004Licentiatavhandling, monografi (Övrigt vetenskapligt)
  • 166. Miyazawa, M.
    et al.
    Hayashi, M.
    Stadler, Rolf
    KTH, Skolan för elektro- och systemteknik (EES), Kommunikationsnät. KTH, Skolan för elektro- och systemteknik (EES), Centra, ACCESS Linnaeus Centre.
    VNMF: Distributed fault detection using clustering approach for network function virtualization2015Ingår i: Proceedings of the 2015 IFIP/IEEE International Symposium on Integrated Network Management, IM 2015, IEEE conference proceedings, 2015, s. 640-645Konferensbidrag (Refereegranskat)
    Abstract [en]

    Network function virtualization introduces additional complexity for network management through the use of virtualization environments. The amount of managed data and the operational complexity increases, which makes service assurance and failure recovery harder to realize. In response to this challenge, the paper proposes a distributed management function, called virtualized network management function (vNMF), to detect failures related to virtualized services. vNMF detects the failures by monitoring physical-layer statistics that are processed with a self-organizing map algorithm. Experimental results show that memory leaks and network congestion failures can be successfully detected and that and the accuracy of failure detection can be significantly improved compared to common k-means clustering.

  • 167.
    Modaresi, Mahyar
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Kommunikationssystem, CoS.
    System and Method for Passive Radiative RFID Tag Positioning in Realtime for both Elevation and Azimuth Directions2010Självständigt arbete på avancerad nivå (masterexamen), 20 poäng / 30 hpStudentuppsats (Examensarbete)
    Abstract [en]

    In this thesis, design and realization of a system which enables precise positioning of RFID tags in both azimuth and elevation angles is explained. The positioning is based on measuring the phase difference between four Yagi antennas placed in two arrays. One array is placed in the azimuth plane and the other array is perpendicular to the first array in the elevation plane. The phase difference of the signals received from the antennas in the azimuth array is used to find the position of RFID tag in the horizontal direction. For the position in the vertical direction, the phase difference of the signals received from the antennas in the elevation plane is used. After that the position of tag in horizontal and vertical directions is used to control the mouse cursor in the horizontal and vertical directions on the computer screen. In this way by attaching one RFID tag to a plastic rod, a wireless pen is implemented which enables drawing in the air by using a program like Paint in Windows. Simulated results show that the resolution of the tag positioning in the system is in the order of 3mm in a distance equal to 0.5 meter in front of the array with few number of averaging over the received phase data. Using the system in practice reveals that it is easily possible to write and draw with this RFID pen. In addition it is argued how the system is totally immune to any counterfeit attempt for faked drawings by randomly changing the transmitting antenna in the array. This will make the system a novel option for human identity verification.

    Ladda ner fulltext (pdf)
    FULLTEXT01
  • 168.
    Moghaddami Khalilzad, Nima
    et al.
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Elektronik och Inbyggda System. Mälardalens högskola, Akademin för innovation, design och teknik.
    Behnam, Moris
    Mälardalens högskola, Akademin för innovation, design och teknik.
    Nolte, Thomas
    Mälardalens högskola, Akademin för innovation, design och teknik.
    Implementation of the Multi-Level Adaptive Hierarchical Scheduling Framework2013Ingår i: Proceedings of OSPERT 2013, SYSGO AG , 2013, s. 11-19Konferensbidrag (Refereegranskat)
    Abstract [en]

    We have presented a multi-level adaptive hierarchical scheduling framework in our previous work. The framework targets compositional real-time systems which are composed of both hard and soft real-time systems. While static CPU portions are reserved for hard real-time components, the CPU portions of soft real-time components are adjusted during run-time. In this paper, we present the implementation details of our framework which is implemented as a Linux kernel loadable module. In addition, we present a case-study to evaluate the performance and the overhead of our framework.

  • 169.
    Moghaddami Khalilzad, Nima
    et al.
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Elektronik och Inbyggda System. Mälardalens högskola, Akademin för innovation, design och teknik.
    Behnam, Moris
    Mälardalens högskola, Akademin för innovation, design och teknik.
    Nolte, Thomas
    Mälardalens högskola, Akademin för innovation, design och teknik.
    Multi-Level Adaptive Hierarchical Scheduling Framework for Composing Real-Time Systems2013Ingår i: 2013 IEEE 19th International Conference on Embedded and Real-Time Computing Systems and Applications, RTCSA 2013, IEEE Computer Society, 2013, s. 320-329Konferensbidrag (Refereegranskat)
    Abstract [en]

    Processor partitioning and hierarchical scheduling have been widely used for composing hard real-time systems on a shared hardware platform while preserving the timing requirements of the systems. Due to the safety critical nature of the hard real-time systems for deriving the sufficient partition size often conservative analysis is used. Applying the exact same analysis for deriving the partition sizes for soft real-time systems result in unnecessary processors overallocation and consequently waste of the CPU resource. In this paper, to address the problem of composing soft and hard real-time systems on a resource constrained shared hardware, we present a multi-level adaptive hierarchical scheduling framework. In our framework, we adapt the processor partition sizes of soft real-time systems according to their need at each time point by on-line monitoring their processor demand. Furthermore, we implement our adaptive framework in the Linux kernel and show the performance of our framework using a case-study.

  • 170.
    Muddukrishna, Ananya
    et al.
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Elektroniksystem.
    Jonsson, Peter A.
    SICS Swedish ICT AB.
    Brorsson, Mats
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Programvaruteknik och Datorsystem, SCS. SICS Swedish ICT AB.
    Locality-aware Task Scheduling and Data Distribution for OpenMP Programs on NUMA Systems and Manycore Processors2015Ingår i: Scientific Programming, ISSN 1058-9244, E-ISSN 1875-919X, artikel-id 981759Artikel i tidskrift (Refereegranskat)
    Abstract [en]

    Performance degradation due to nonuniform data access latencies has worsened on NUMA systems and can now be felt on-chip in manycore processors. Distributing data across NUMA nodes and on manycore processors is necessary to reduce the impact of nonuniform latencies. However, techniques for distributing data are error-prone and fragile and require low-level architectural knowledge. Existing task scheduling policies favor quick load-balancing at the expense of locality and ignore NUMA node access latencies while scheduling. Locality-aware scheduling, in conjunction with or as a replacement for existing scheduling, is necessary to minimize NUMA effects and sustain performance. We present a data distribution and locality-aware scheduling technique for task-based OpenMP programs executing on NUMA systems and manycore processors. Our technique relieves the programmer from thinking of NUMA architecture details by delegating data distribution to the runtime system and uses task data dependence information to guide the scheduling of OpenMP tasks to reduce data stall times. We demonstrate our technique on a four-socket AMD Opteron machine with eight NUMA nodes and on the TILEPro64 processor, and we identify that data distribution and locality-aware task scheduling improve performance up to 69% for scientific benchmarks compared to default policies and yet provide an architecture-oblivious approach for programmers.

  • 171.
    Mårtensson, Anders
    KTH, Skolan för teknik och hälsa (STH), Medicinsk teknik, Data- och elektroteknik.
    User Experinences in 3D2016Självständigt arbete på grundnivå (yrkesexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
    Abstract [sv]

    3D-gränssnitt är vanliga idag när man till exempel arbetar med industridesign och arkitektritningarmen de används vanligtvis inte i vanliga program. Hårdvarurestriktioner har varit en stor faktor var-för de inte har haft dessa, men dagens datorer och mobila enheter som har integrerade grafikkort somklarar av att köra de flesta 3D-gränssnitt.Rapporten fann att användare av 3D-gränssnitt tyckte de var roligare att använda och ger en bättreöverblick när informationsdensiteten är hög. Problem uppstår när man använder små skärmar ochbehöver läsa text. Framtida förbättringar i mjukvaruverktyg och API:er, förbättringar i hårdvara ochnya teknologier som t.ex. virtuell- och förstärktverklighet kommer göra att 3D-grännsnitt

    Ladda ner fulltext (pdf)
    UserExperiencesIn3D
  • 172.
    Möller, Joakim
    KTH, Skolan för datavetenskap och kommunikation (CSC), Numerisk Analys och Datalogi, NADA.
    Aspects of the recursive projection method applied to flow calculations2005Doktorsavhandling, sammanläggning (Övrigt vetenskapligt)
    Abstract [en]

    In this thesis, we have investigated the Recursive Projection Method, RPM, as an accelerator for computations of both steady and unsteady flows, and as a stabilizer in a bifurcation analysis.

    The criterion of basis extraction is discussed. It can be interpreted as a tolerance for the accuracy of the eigenspace spanned by the identified basis, alternatively it can be viewed as a criterion when the approximative Krylov sequence becomes numerically rank deficient.

    Steady state calculations were performed on two different turbulent test-cases; a 2D supersonic nozzle flow with the Spalart-Allmaras 1-equation model and a 2D sub-sonic airfoil simulation using the κ - ε model. RPM accelerated the test-cases with a factor between 2 and 5.

    In multi-scale problems, it is often of interest to model the macro-scale behavior, still retaining the essential features of the full systems. The ``coarse time stepper'' is a heuristic approach for circumventing the analytical derivation of models. The system studied here is a linear lattice of non-linear reaction sites coupled by diffusion. After reformulation of the time-evolution equation as a fixed-point scheme, RPM coupled with arc-length continuation is used to calculate the bifurcation diagrams of the effective (but analytically unavailable) equation.

    Within the frame-work of dual time-stepping, a common approach in unsteady CFD-simulation, RPM is used to accelerate the convergence. Two test-cases were investigated; the von Karman vortex-street behind a cylinder at Re=100, and the periodic shock oscillation of a symmetric airfoil at M ∞ = 0.76 with a Reynolds number Re=11 x 106.

    It was believed that once a basis had been identified, it could be retained for several steps. The simulations usually showed that the basis could only be retained for one step.

    The need for updating the basis motivates the use of Krylov methods. The most common method is the (Block-) Arnoldi algorithm. As the iteration proceeds, Krylov methods become increasingly expensive and restart is required. Two different restart algorithm were tested. The first is that of Lehoucq and Maschhoff, which uses a shifted QR iteration, the second is a block extension of the single-vector Arnoldi method due to Stewart. A flexible hybrid algorithm is derived combining the best features of the two.

    Ladda ner fulltext (pdf)
    FULLTEXT01
  • 173.
    Möller, Joakim
    KTH, Tidigare Institutioner                               , Numerisk analys och datalogi, NADA.
    New Implementations of the Implicitly Restarted Block Arnoldi Method2004Rapport (Övrigt vetenskapligt)
  • 174.
    Möller, Joakim
    KTH, Tidigare Institutioner                               , Numerisk analys och datalogi, NADA.
    The Recursive Projection Method Applied to Steady-state CFD Calculations2004Rapport (Övrigt vetenskapligt)
  • 175.
    Möller, Joakim
    et al.
    KTH, Skolan för datavetenskap och kommunikation (CSC), Numerisk Analys och Datalogi, NADA.
    Runborg, Olof
    KTH, Skolan för datavetenskap och kommunikation (CSC), Numerisk Analys och Datalogi, NADA.
    Kevrekidis, P.G.
    Lust, K.
    Kevrekidis, I.G.
    Equation-free, effective computation for discrete systems: a time stepper based approach2005Ingår i: International Journal of Bifurcation and Chaos in Applied Sciences and Engineering, ISSN 0218-1274, Vol. 15, nr 3, s. 975-996Artikel i tidskrift (Refereegranskat)
    Abstract [en]

    We propose a computer-assisted approach to studying the effective continuum behavior of spatially discrete evolution equations. The advantage of the approach is that the "coarse model" (the continuum, effective equation) need not be explicitly constructed. The method only uses a time-integration code for the discrete problem and judicious choices of initial data and integration times; our bifurcation computations are based on the so-called Recursive Projection Method (RPM) with arc-length continuation [Shroff & Keller, 1993]. The technique is used to monitor features of the genuinely discrete problem such as the pinning of coherent structures and its results are compared to quasi-continuum approaches such as the ones based on Pade approximations.

  • 176.
    Nayyar, Raghu
    et al.
    KTH, Skolan för elektroteknik och datavetenskap (EECS), Medieteknik och interaktionsdesign, MID.
    Gürdür, Didem
    KTH, Skolan för industriell teknik och management (ITM), Maskinkonstruktion (Inst.), Mekatronik.
    Vulgarakis Feljan, Aneta
    Ericsson Research, Stockholm, Sweden.
    Visualizing Autonomous Warehouse Data Streams Through User-Centered Design2019Ingår i: Proceedings of The Fifth International Conference on Big Data, Small Data, Linked Data and Open DataALLDATA 2019, 2019Konferensbidrag (Refereegranskat)
    Abstract [en]

    This paper summarizes the work is done, which is carried out to develop and evaluate a dashboard design that visualizes a stream of data from different entities involved in autonomous warehouses, as a subset of cyber-physical systems. The dashboard is designed and developed through User- Centered Design (UCD) methodologies based on two iterations of feedback sessions with the stakeholders. During these sessions, semi-structured expert opinion interviews are conducted. The paper discusses the different stages involved in building the proposed dashboard design, the design decisions, the technical aspects of the libraries used, and the results of the feedback sessions towards the end of the project. It also presents the implemented dashboard as proof of development efforts and explains its different functionalities. The study concludes by evaluating the dashboard through the semi-structured interviews with the respective stakeholders and suggests features for further development.

    Ladda ner fulltext (pdf)
    fulltext
  • 177. Negash, B.
    et al.
    Westerlund, T.
    Liljeberg, P.
    Tenhunen, Hannu
    KTH. Department of Information Technology, University of Turku, Turku, Finland.
    Rethinking ‘Things’ - Fog layer interplay in IoT: A mobile code approach2018Ingår i: 11th IFIP WG 8.9 Working Conference on Research and Practical Issues of Enterprise Information Systems, CONFENIS 2017, Springer, 2018, Vol. 310, s. 159-167Konferensbidrag (Refereegranskat)
    Abstract [en]

    A client-server architecture style is one of the common approaches enabling separation of concerns in distributed systems. In the Internet of Things architecture, this approach exists in different configuration of sensors, actuators, gateways in the Fog layer and servers in the Cloud. This configuration affects the degree of interoperability, scalability and other functional and non-functional system requirements. In this paper, we reflect on best practices in the web and REST style to address IoT challenges; one of the constraints in REST, Code on Demand, is used for IoT to enhance the flexibility and interoperability of resource constrained clients at the perception layer. Scripts written in a domain specific language, DoS-IL, are organized and stored at the Fog layer for sensor and actuators nodes to request and execute the incoming script. A generic application layer protocol and RESTful server are presented along with experimental results.

  • 178.
    Nguyen, John
    et al.
    KTH, Skolan för kemi, bioteknologi och hälsa (CBH), Medicinteknik och hälsosystem, Hälsoinformatik och logistik.
    Lindén, Kasper
    KTH, Skolan för kemi, bioteknologi och hälsa (CBH), Medicinteknik och hälsosystem, Hälsoinformatik och logistik.
    Creating a Back Stock to Increase Order Delivery and Pickup Availability2019Självständigt arbete på grundnivå (högskoleexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
    Abstract [sv]

    Apotek Hjärtat vill fortsätta utveckla sin e-handelssida och förbättra upphämtning och leverans av ordrar till kund. Click and Collect och Click and Express är två val för att hämta upp e-handelsordrar som finns tillgängliga om alla produkter i ordern finns i butik. Genom att implementera ett baklager i butiker med populära unika ehandelsprodukter kommer alla produkter i en order oftare att finnas i butik. Baklagret kommer på så vis öka tillgängligheten av Click and Collect och Click and Express. Målen är att utföra en förstudie, samt att jämföra och hitta en bra lösning att implementera en modell för att uppnå målen. Förstudien gick ut på att analysera tidigare arbeten inom matematiska statistikmetoder och maskininlärningsmetoder. Den statistiska metoden utfördes genom det analytiska verktyget Statistical Package for the Social Sciences (SPSS) och Java. Maskininlärningsmetoden utvecklades med hjälp av Python och Scikit-learn biblioteket. Maskinlärningsmetoden utfördes genom en regressionsalgoritm som användes för att ta fram flera modeller för relationer mellan försäljning av kategorier och pollenprognoser. Statistiska metoden och maskininlärningsmetoden jämfördes med varandra. Båda gav identiska resultat men maskininlärning var mer funktionellt och enklare att vidareutveckla och därför valdes den metoden. Flera olika modeller lyckades tas fram för en del produktkategorier. De kategorier som inte fungerade för modellerna hade orealistiska mängder sålda varor. Dessa mängder kunde vara negativa eller extremt höga när okända inputs introducerades. Med hjälp av simulationen var det möjligt att uppskatta hur baklagret skulle öka tillgängligheten av Click and Collect/Express. Maskininlärningsmodellerna skulle behöva mer data, som kommer i framtiden, för att ge en mer precis prediktering mellan pollenvärden. Som slutsats är det möjligt att använda dem i framtiden för vissa kategorier som allergi och barnmedicin.

    Ladda ner fulltext (pdf)
    Creating a Back Stock - John Nguyen and Kasper Lindén
  • 179. Ngyen, T.
    et al.
    Jafri, Syed
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Elektronik och Inbyggda System. Turku Centre for Computer Science, Finland.
    Daneshtalab, Masoud
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Elektronik och Inbyggda System. University of Turku, Finland .
    Hemani, Ahmed
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Elektronik och Inbyggda System.
    Dytckov, Sergei
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Elektronik och Inbyggda System.
    Plosila, Juha
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Elektronik och Inbyggda System. University of Turku, Finland .
    Tenhunen, Hannu
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Elektronik och Inbyggda System. University of Turku, Finland.
    FIST: A framework to interleave spiking neural networks on CGRAs2015Ingår i: Proceedings - 23rd Euromicro International Conference on Parallel, Distributed, and Network-Based Processing, PDP 2015, IEEE , 2015, s. 751-758Konferensbidrag (Refereegranskat)
    Abstract [en]

    Coarse Grained Reconfigurable Architectures (CGRAs) are emerging as enabling platforms to meet the high performance demanded by modern embedded applications. In many application domains (e.g. robotics and cognitive embedded systems), the CGRAs are required to simultaneously host processing (e.g. Audio/video acquisition) and estimation (e.g. audio/video/image recognition) tasks. Recent works have revealed that the efficiency and scalability of the estimation algorithms can be significantly improved by using neural networks. However, existing CGRAs commonly employ homogeneous processing resources for both the tasks. To realize the best of both the worlds (conventional processing and neural networks), we present FIST. FIST allows the processing elements and the network to dynamically morph into either conventional CGRA or a neural network, depending on the hosted application. We have chosen the DRRA as a vehicle to study the feasibility and overheads of our approach. Synthesis results reveal that the proposed enhancements incur negligible overheads (4.4% area and 9.1% power) compared to the original DRRA cell.

  • 180.
    Niemelä, Jimmy
    KTH, Skolan för teknik och hälsa (STH), Medicinsk teknik, Data- och elektroteknik.
    Impostor Rendering with Oculus Rift2014Självständigt arbete på grundnivå (högskoleexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
    Abstract [sv]

    Denna rapport undersöker renderingstekniken impostors när den används i en simpel 3D motor tillsammans med virtuella verklighetshjälmen Oculus Rift. Impostors betyder på engelska bedragare och tekniken går ut på att den byter ut avancerade 3D modeller mot simpla 2D versioner när de är ett visst avstånd ifrån användarens virtuella kamera. Om den är korrekt implementerad ska användaren inte märka att vissa modeller är platta och tekniken sparar på resurser då grafikmotorn inte behöver rita ut alla modeller. Rapporten går igenom vad som undersöktes i förundersökningen för att kunna utveckla en prototyp med utvecklingspråket C++ och DirectX 11. I rapporten står även hur prototypen utvecklades och hur stöd för Oculus Rift lades till. De slutliga resultaten visade att impostors hade en stor påverkan på uppdateringshastigheten när antalet 3D modeller som skulle ritas var många, annars hade tekniken ingen påverkan för att nå 60 bilder per sekund. 2 testare från Nordicstation kom fram till att ett avstånd på 40-50 meter från spelarens kamera till utritning av impostors var lämplig, för att dölja att de endast är platta versioner av 3d modeller. Testet visade att motorn kunde rita ut 3000 träd, med 1000 löv på varje, och hålla 60 bilder per sekund, vilket var målet. Detta på ett avstånd av 40m på impostors. Impostorrendering var effektiv när man ritade ut fler än 500 träd åt gången. Mindre antal gav ingen märkbar effekt på testdatorn som användes för testet.

    Ladda ner fulltext (pdf)
    ImpostorRenderingWithOculusRift
  • 181.
    Nikitovic, Mladen
    et al.
    KTH, Tidigare Institutioner, Mikroelektronik och informationsteknik, IMIT.
    Brorsson, Mats
    KTH, Tidigare Institutioner, Mikroelektronik och informationsteknik, IMIT.
    A multiprogrammed workload model for energy and performance estimation of adaptive chip-multiprocessors2004Ingår i: Proceedings of 18th International  Parallel and Distributed Processing Symposium, 2004, IEEE , 2004, s. 3449-3456Konferensbidrag (Refereegranskat)
    Abstract [en]

    Summary form only given. Today, there is a trend towards steadily increasing functionality in mobile terminals. This trend in turn increases the performance demand on the architecture that is supposed to do all the work. It is likely that more traditional architectures like multiprocessors are used in future mobile terminals. They are attractive because they can now be integrated on a single chip and can provide the desired performance efficiently if intelligently managed. Choosing the most efficient architecture configuration is however a complex issue and depends on multiple factors. We believe that the way the behavior of the workload is modeled is of paramount importance when estimating the efficiency of any proposed architecture for future mobile terminals. Therefore, a deterministic and simple workload description is needed. In this paper, we show how such a multiprogrammed workload is created and used for energy and performance estimation of an adaptive chip-multiprocessor (CMP) architecture.

    Ladda ner fulltext (pdf)
    fulltext
  • 182.
    Nikitovic, Mladen
    et al.
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Kommunikation: Infrastruktur och tjänster, Programvaru- och datorsystem, SCS.
    De Schampheleire, Thomas
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Kommunikation: Infrastruktur och tjänster, Programvaru- och datorsystem, SCS.
    Brorsson, Mats
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Kommunikation: Infrastruktur och tjänster, Programvaru- och datorsystem, SCS.
    A study on periodic shutdown for adaptive CMPs in handheld devices2008Ingår i: 2008 13TH ASIA-PACIFIC COMPUTER SYSTEMS ARCHITECTURE CONFERENCE, New York: IEEE , 2008, s. 308-314Konferensbidrag (Refereegranskat)
    Abstract [en]

    The challenge to satisfy the demand for higher computing performance has become an increasingly difficult task to achieve. In the area of mobile devices, this demand has to be carefully balanced with an efficient use of the power source. We propose the use of an adaptive architecture that enables savings in power and energy in an intuitive way, considering the properties of future process technologies. We satisfy performance demand by utilizing thread-level parallelism and minimize the power and energy consumption by proposing an adaptive strategy that manages the power state of each individual CMP-core. In this study, we propose a periodical shutdown strategy and evaluate it in a multiprogrammed workload environment. Results show that a large amount of idle time, 77 %, can be saved by putting processors into power-saving states. Furthermore, introducing timeouts can dramatically decrease the number of state transitions.

  • 183. Niwa, T.
    et al.
    Miyazawa, M.
    Hayashi, M.
    Stadler, Rolf
    KTH, Skolan för elektro- och systemteknik (EES), Kommunikationsnät. KTH, Skolan för elektro- och systemteknik (EES), Centra, ACCESS Linnaeus Centre.
    Universal fault detection for NFV using SOM-based clustering2015Ingår i: 17th Asia-Pacific Network Operations and Management Symposium: Managing a Very Connected World, IEEE , 2015, s. 315-320Konferensbidrag (Refereegranskat)
    Abstract [en]

    Network function virtualization (NFV) introduces additional complexity to network management, since the placement and behavior of virtualized network functions (VNFs) can be independent from the underlying hardware, and virtualization technology increases the number of monitoring points and the amount of statistical data. In our previous work, we proposed a framework for detecting anomalous behavior of VNFs using a SOM-based technique. The solution relies upon manually configuring the SOM clustering parameters and selecting the statistics for each failure type in advance, which results in a high maintenance load. In this paper, we provide a solution that is universal in the sense that a range of different faults can be detected using a single set of local statistics and SOM clustering parameters. Experimental results from a testbed show that faults, including memory leak, packet congestion, and session congestion, can be detected with high accuracy using only four types of performance statistics.

  • 184.
    Nordlund, Alexander
    et al.
    KTH, Skolan för kemi, bioteknologi och hälsa (CBH), Medicinteknik och hälsosystem, Hälsoinformatik och logistik.
    Ålander, Niklas
    KTH, Skolan för kemi, bioteknologi och hälsa (CBH), Medicinteknik och hälsosystem, Hälsoinformatik och logistik.
    Forecast Modelling of Future Events that Affect the Repayment Capacity of Mortgages2019Självständigt arbete på grundnivå (högskoleexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
    Abstract [sv]

    Finansinspektionen införde nya riktlinjer och föreskrifter den 1 mars 2019. Dessa föreskrifter anvisade banker och andra borgenärer att ha ett framåtblickande perspektiv för att förbättra deras förmåga att bedöma gäldenärers risk. En beräkningsmotor skapades som ett verktyg för att genomföra detta. Avgränsningarna för denna avhandling begränsar beräkningsmotorn till konsumenter som köper bostadskrediter med fyra parametrar: inkomstbortfall, pension, utländsk valuta och värdeminskning. Beräkningsmotorn skapades genom att kombinera komponenter från Vitec Capitex's existerande beräkningsmotor samt genom att lägga till nya komponenter. De nya komponenterna användes för att beräkna lån och budget för gäldenärer över tid, samt beräkna en passande inkomstförsäkring utifrån ett inkomstbortfall. Vidare kunde beräkningsmotorn approximera en pensionsinkomst efter gäldenären gått i pension. Beräkningsmotorn kunde även beräkna den ekonomiska situationen för gäldenärer efter en framtida händelse inträffat som inkomstbortfall eller en tidig pension. En lämplig inkomstförsäkring skulle skydda en gäldenär från obestånd ifall ett inkomstbortfall inträffat.

    Ladda ner fulltext (pdf)
    Alexander_Niklas_Thesis
  • 185.
    Ntis, Christina
    et al.
    KTH, Skolan för kemi, bioteknologi och hälsa (CBH), Medicinteknik och hälsosystem, Hälsoinformatik och logistik.
    Causevic, Neira
    KTH, Skolan för kemi, bioteknologi och hälsa (CBH), Medicinteknik och hälsosystem, Hälsoinformatik och logistik.
    En utvärdering av en verktygsdriven UX-designprocess: Tillämpning och utvärdering av en verktygsdriven UX-designprocess vid användning av Kibana2018Självständigt arbete på grundnivå (högskoleexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
    Abstract [sv]

    I dagsläget finns det en mängd utmaningar och svårigheter inom den traditio- nella designprocessen för användarupplevelse (UX, User Experience). Dessa utmaningar har en påverkan på hur tidskrävande och kostsam en designpro- cess för UX kan vara. Några av dem är att få prototyper att likna slutpro- dukten och kommunikationssvårigheter mellan UX-designers och utvecklare vid Agil projektmetodik. Några svårigheter som finns vid visualisering av strömmande data är att göra den lättförståelig för användaren och möjliggöra användaren att nå önskad information.

    För att undersöka dessa svårigheter togs en designprocess för UX, att använ- das med datavisualiseringsverktyget Kibana, fram. För att kunna utvärdera och bedöma designprocessen för UX, skapades en interaktiv dashboard som presenterade Transportstyrelsens data från betalstationer. Framtagningen av designprocessen för UX resulterade i en optimering av prototypskapandet och testningen. Detta eftersom designprocessen för UX möjliggjorde utveckling av produkten, istället för prototypen, vilket förbättrade testningen med slutan- vändaren och därmed även slutprodukten. Det fanns dock nackdelar då Kiba- na användes vilka var begränsningar i modifieringen av användargränssnittet och att systemet behövde vara klart innan designprocessen för UX kunde på- börjas.

    Ladda ner fulltext (pdf)
    En utvärdering av en verktygsdriven UX-designprocess
  • 186. Nurcan, S.
    et al.
    Johnson, Pontus
    KTH, Skolan för elektroteknik och datavetenskap (EECS), Datavetenskap, Nätverk och systemteknik.
    Message from the EDOC 2018 program chairs2018Ingår i: 22nd IEEE International Enterprise Distributed Object Computing Conference, EDOC 2018, artikel-id 8536137Artikel i tidskrift (Refereegranskat)
  • 187.
    Oechtering, Tobias J.
    et al.
    KTH, Skolan för elektro- och systemteknik (EES), Kommunikationsteori. KTH, Skolan för elektro- och systemteknik (EES), Centra, ACCESS Linnaeus Centre.
    Skoglund, Mikael
    KTH, Skolan för elektro- och systemteknik (EES), Kommunikationsteori. KTH, Skolan för elektro- och systemteknik (EES), Centra, ACCESS Linnaeus Centre.
    Upper bound to error probability for coding on bidirectional broadcast channels2010Ingår i: ICT 2010: 2010 17th International Conference on Telecommunications, 2010, s. 48-55Konferensbidrag (Refereegranskat)
    Abstract [en]

    The bidirectional broadcast channel denotes a broadcast channel with two receivers where each receiver knows the message intended for the other. Exponentially decreasing upper bounds on the average error probability using maximum likelihood decoders are derived based on Gallager's results for the point-to-point channel. The bounds are coupled by the common input distribution and provide an alternative coding theorem using the random coding argument. Then the results are extended to include an average input constraint and to continuous-valued channels. For illustration the bidirectional broadcast channel with binary symmetric channels and with Gaussian channels and an average input power constraint are discussed in detail.

  • 188. Olsson, E
    et al.
    Funk, P
    Bengtsson, Marcus
    Fault diagnosis of industrial robots using acoustic signals and case-based reasoning2004Ingår i: Lecture notes in computer science, 2004, Vol. 3155, s. 686-701Konferensbidrag (Refereegranskat)
    Abstract [en]

    In industrial manufacturing rigorous testing is used to ensure that the delivered products meet their specifications. Mechanical maladjustment or faults often show their presence through abnormal acoustic signals. This is the same case in robot assembly - the application domain addressed in this paper. Manual diagnosis based on sound requires extensive experience, and usually such experience is acquired at the cost of reduced production efficiency or degraded product quality due to mistakes in judgments. The acquired experience is also difficult to preserve and transfer and it often gets lost if the corresponding personnel leave the task of testing. We propose herein a Case-Based Reasoning approach to collect, preserve and reuse the available experience for robot diagnosis. This solution enables fast experience transfer and more reliable and informed testing. Sounds from normal and faulty robots are recorded and stored in a case library together with their diagnosis results. Given an unclassified sound signal, the relevant cases are retrieved from the case library as reference for deciding the fault class of the new case. Adding new classified sound profiles to the case library improves the system's performance. So far the developed system has been applied to the testing environment for industrial robots. The preliminary results demonstrate that our system is valuable in this application scenario in that it can preserve and transfer the related experience among technicians and shortens the overall testing time.

  • 189.
    Onana Alima, Luc
    et al.
    KTH, Tidigare Institutioner                               , Mikroelektronik och informationsteknik, IMIT.
    El-Ansary, Sameh
    Swedish Institute of Computer Science.
    Brand, Per
    Swedish Institute of Computer Science.
    Haridi, Seif
    KTH, Tidigare Institutioner                               , Mikroelektronik och informationsteknik, IMIT.
    DKS(N, k, f): A family of low communication, scalable and fault-tolerant infrastructures for P2P applications2003Ingår i: CCGRID 2003: 3RD IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER COMPUTING AND THE GRID, PROCEEDINGS / [ed] Titsworth, F.; Azada, D., LOS ALAMITOS: IEEE COMPUTER SOC , 2003, s. 344-350Konferensbidrag (Refereegranskat)
    Abstract [en]

    In this paper, we present EKS(N,k,f), a family of infrastructures for building Peer-To-Peer applications. Each instance of EKS(N,k,f) is a fully decentralized overlay network characterized by three parameters: N the maximum number of nodes that can be in the network; k the search arity within the network and f the degree of fault-tolerance. Once these parameters are instantiated, the resulting network has several desirable properties. The first property, which is the main contribution of this paper, is that there is no separate procedure for maintaining routing tables; instead, any out-of-date or erroneous routing entry is eventually corrected on-the-fly thereby, eliminating unnecessary bandwidth consumption. The second property is that each lookup request is resolved in at Most log(k)(N) overlay hops under normal operations. Third, each node maintains only (k - 1) log(k)(N) + 1 addresses of other nodes for routing purposes. Fourth, new nodes can join and existing nodes can leave at will with a negligible disturbance to the ability to resolve lookups in logk(N) hops in average. Fifth, any pair key/value that is inserted into the system is guaranteed to be located even in the presence of concurrent joins. Sixth, even if f consecutive nodes fail simultaneously, correct lookup is still guaranteed.

  • 190.
    Orebäck, Anders
    KTH, Tidigare Institutioner, Numerisk analys och datalogi, NADA.
    A component framework for autonomous mobile robots2004Doktorsavhandling, monografi (Övrigt vetenskapligt)
    Abstract [en]

    The major problem of robotics research today is that there is a barrier to entry into robotics research. Robot system software is complex and a researcher that wishes to concentrate on one particular problem often needs to learn about details, dependencies and intricacies of the complete system. This is because a robot system needs several different modules that need to communicate and execute in parallel.

    Today there is not much controlled comparisons of algorithms and solutions for a given task, which is the standard scientific method of other sciences. There is also very little sharing between groups and projects, requiring code to be written from scratch over and over again.

    This thesis proposes a general framework for robotics. By examining successful systems and architectures of past and present, yields a number of key properties. Some of these are ease of use, modularity, portability and efficiency. Even though there is much consensus on that the hybrid deliberate/reactive is the best architectural model that the community has produced so far, a framework should not stipulate a specific architecture. Instead the framework should enable the building of different architectures. Such a scheme implies that the modules are seen as common peers and not divided into clients and servers or forced into a set layering.

    Using a standardized middleware such as CORBA, efficient communication can be carried out between different platforms and languages. Middleware also provides network transparency which is valuable in distributed systems. Component-based Software Engineering (CBSE) is an approach that could solve many of the aforementioned problems. It enforces modularity which helps to manage complexity. Components can be developed in isolation, since algorithms are encapsulated in components where only the interfaces need to be known by other users. A complete system can be created by assembling components from different sources.

    Comparisons and sharing can greatly benefit from CBSE. A component-based framework called ORCA has been implemented with the following characteristics. All communication is carried out be either of three communication patterns, query, send and push. Communication is done using CORBA, although most of the CORBA code is hidden for the developer and can in the future be replaced by other mechanisms. Objects are transported between components in the form of the CORBA valuetype.

    A component model is specified that among other things include support for a state-machine. This also handles initialization and sets up communication. Configuration is achieved by the presence of an XML-file per component. A hardware abstraction scheme is specified that basically route the communication patterns right down to the hardware level.

    The framework has been verified by the implementation of a number of working systems.

    Ladda ner fulltext (pdf)
    FULLTEXT01
  • 191.
    Palikuca, Aleksandar
    KTH, Skolan för datavetenskap och kommunikation (CSC).
    Authorship Attribution with Neural Networks: A study of the effects of sample size2015Självständigt arbete på grundnivå (kandidatexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
    Abstract [en]

    Authorship attribution is a classification problem with the underlying assumption that each author has a unique, quantifiable writing style. It is therefore assumed that it is possible to determine the author of a particular text based on style markers in the text. Earlier authorship attribution problems focused on books and essays, but the focus has now shifted to short electronic texts such as emails and tweets, which brings up the issue of sample size. In this thesis we try to examine what effect the size of the samples has on classification accuracy by training a neural network on progressively smaller sample sizes. We find that with a sample size of 4500 words per sample, we achieve an accuracy of 98%. The accuracy drops to 70% for samples of 250 words per sample. These results underline the importanceof scalable style markers.

  • 192.
    Palm, Emanuel
    KTH, Skolan för teknik och hälsa (STH), Medicinsk teknik, Data- och elektroteknik.
    Graphics’ Card Utility withWebGL and N-Buffering: Improving performance using N-buffer strategies with WebGL2014Självständigt arbete på grundnivå (högskoleexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
    Abstract [sv]

    Denna uppsats granskar nyttjandet av N buffrar för att minska uppkomsten av resurskonflikter på en abstrakt WebGL maskin, och således frigöra processtid på maskinen i fråga. De typer av buffrar som vidrörs är så kallade frame buffers och vertex buffers.

    Uppsatsen går också igenom syftet och funktionen hos N buffrar i relation till grafik och funktionen hos en WebGL maskin, förstudien kring och produktionen av prestandatest-prototyper, en del relevanta mätresultat, samt analys och slutsatser.

    Slutsatsen nås att nyttjandet av N>1 buffrar är en potentiellt gångbar strategi för ökandet av prestanda hos WebGL, och en del teorier presenteras och förslag ges kring ytterligare studier för attöka prestanda ytterligare.

    Ladda ner fulltext (pdf)
    N-Buffering and WebGL
    Ladda ner (zip)
    Cloud Prototype
  • 193. Pang, Z.
    et al.
    Cheng, Yuxin
    KTH, Skolan för informations- och kommunikationsteknik (ICT).
    Johansson, M. E.
    Bag, G.
    Work-in-progress: Industry-friendly and native-IP wireless communications for building automation2015Ingår i: Proceedings of the 2015 1st International Conference on Industrial Networks and Intelligent Systems, INISCom 2015, IEEE conference proceedings, 2015, s. 163-167Konferensbidrag (Refereegranskat)
    Abstract [en]

    Wireless communication technologies for building automation (BA) systems are evolving towards native IP connectivity. More Industry Friendly and Native-IP Wireless Building Automation (IF-NIP WiBA) is needed to address the concerns of the entire value chain of the BA industry including the security, reliability, latency, power consumption, engineering process, and independency. In this paper, a hybrid architecture which can seamless support both Cloud-Based Mode and Stand-Alone Mode is introduced based on the 6LoWPAN WSAN (wireless sensor and actuator networks) technology and verified by a prototyping minimal system. The preliminary experimental results suggest that, 1) both the WSAN and Cloud communications can meet the requirements of non-real-time application of BA systems, 2) the reliability and latency of the WSAN communications is not sufficient for soft real-time applications but it is not far away to meet such requirements by sufficient optimization in the near future, 3) the reliability of Cloud is pretty sufficient but the latency is quite far from the requirement of soft real-time applications. To optimize the latency and power consumption in WSAN, design industrial friendly engineering process, and investigate security mechanisms should be the main focus in the future.

  • 194.
    Parizi, Sobhan Naderi
    et al.
    KTH, Skolan för datavetenskap och kommunikation (CSC), Datorseende och robotik, CVAP.
    Laptev, Ivan
    Targhi, Alireza Tavakoli
    KTH, Skolan för datavetenskap och kommunikation (CSC), Datorseende och robotik, CVAP.
    Modeling Image Context using Object Centered Grid2009Ingår i: 2009 DIGITAL IMAGE COMPUTING: TECHNIQUES AND APPLICATIONS (DICTA 2009), NEW YORK: IEEE , 2009, s. 476-483Konferensbidrag (Refereegranskat)
    Abstract [en]

    Context plays a valuable role in any image understanding task confirmed by numerous studies which have shown the importance of contextual information in computer vision tasks, like object detection, scene classification and image retrieval. Studies of human perception on the tasks of scene classification and visual search have shown that human visual system makes extensive use of contextual information as post-processing in order to index objects. Several recent computer vision approaches use contextual information to improve object recognition performance. They mainly use global information of the whole image by dividing the image into several pre-defined subregions, so called fixed grid. In this paper we propose an alternative approach to retrieval of contextual information, by customizing the location of the grid based on salient objects in the image. We claim this approach to result in more informative contextual features compared to the fixed-grid based strategy. To compare our results with the most relevant and recent papers, we use PASCAL 2007 data set. Our experimental results show an improvement in terms of Mean Average Precision.

  • 195.
    Pathan, Sakib
    et al.
    KTH, Skolan för teknik och hälsa (STH), Medicinsk teknik, Data- och elektroteknik.
    Stenström, Erik
    KTH, Skolan för teknik och hälsa (STH), Medicinsk teknik, Data- och elektroteknik.
    Säkerhetsfrågor beträffande Sakernas Internet med fokus på fastighetsinfrastruktur2015Självständigt arbete på grundnivå (yrkesexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
    Abstract [sv]

    I detta examensarbete görs en analys av säkerheten hos några av de driftundercentraler som används i fastigheter som Riksbyggen förvaltar. Driftundercentralerna används för att kontrollera olika delar i en fastighet, exempelvis belysning och temperatur. I de flesta fall nås respektive driftundercentral via en egen publik IP-adress, medan vissa tillverkare har en molntjänst för sina driftundercentraler. Syftet med examensarbetet har varit att undersöka de olika driftundercentralernas säkerhet, upptäcka brister och ge förbättringsförslag till dessa. Därutöver ges också exempel på hur smarta hem kan byggas upp.

    Undersökningen har gjorts på flera sätt, dels med hjälp av kontrollerade attacker men även genom att samla information om driftundercentralerna och hur de fungerar. Utifrån de undersökningar som gjorts har ett antal brister kunnat konstateras, bl.a. när det gäller lösenordens styrka och kryptering av dessa. Generella förslag på förbättringar har getts för att minska sårbarheten för eventuella attacker som kan ske i framtiden.

    Ladda ner fulltext (pdf)
    Rapport
  • 196.
    Paunovic, Stefan
    et al.
    KTH, Skolan för teknik och hälsa (STH), Medicinsk teknik, Data- och elektroteknik.
    Hiwa Kader, Baran
    KTH, Skolan för teknik och hälsa (STH), Medicinsk teknik, Data- och elektroteknik.
    Optimering av 1177 Vårdguidens teletjänstcentraler2017Självständigt arbete på grundnivå (högskoleexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
    Abstract [sv]

    Teletjänstcentraler används idag inom många områden för kundbetjäning av olika slag med målet att ge så bra service som möjligt. Problematiken är då flertalet instanser tillhandahåller samma tjänster men där dem ansvarar för ett eget geografiskt område. Ett ofta förekommande problem som uppstår är att belastningen mellan dessa teletjänstcentraler varierar drastiskt, vissa har allt för mycket att göra medans andra inte har något alls.

    Det är därför av intresse att analysera en samverkan mellan dessa centraler och granska eventuella förändringar i effektivitet. I dagsläget har 1177 vårdguiden ett system som hanterar samtalsflödet där ett telefonsamtal skickas till närmaste teletjänstcentral, inom samma region.

    Softronic fick tidigare i uppdrag att analysera och optimera 1177 Vårdguidens teletjänstsystem genom att effektivisera samt höja kvaliteten på samtalshanteringen. Detta genom snabbare svarstid och ökad samtalshantering inom samma region. Softronic har framtagit två modeller, med givande resultat, dock inte helt i linje med målen. Det är detta som ligger till grund för detta examensarbete.

    Efter en grundläggande analys användes 6 stycken unika modeller varav 3 av dessa utvecklades under examensarbetet. Dessa modeller är utformade enligt flertalet parametrar och tar hänsyn till bl.a. kompetens. Kompetens baseras på var ett samtal besvaras geografiskt samt hur länge samtalet varit placerad i kön. Dessa modeller simulerades med hjälp av ett verktyg som utvecklades för detta ändamål och dessa resultat jämfördes. Resultatet av dessa simuleringar visade att den bästa modellen var då en kombination av samverkan mellan en lokal och nationell kö.

    Ladda ner fulltext (pdf)
    Optimering av 1177 Vårdguidens teletjänstcentraler
  • 197.
    Peng, I. B.
    et al.
    KTH, Skolan för datavetenskap och kommunikation (CSC), Beräkningsvetenskap och beräkningsteknik (CST).
    Gioiosa, R.
    Kestor, G.
    Cicotti, P.
    Laure, Erwin
    KTH, Skolan för datavetenskap och kommunikation (CSC), Beräkningsvetenskap och beräkningsteknik (CST).
    Markidis, Stefano
    KTH, Skolan för datavetenskap och kommunikation (CSC), Beräkningsvetenskap och beräkningsteknik (CST).
    Exploring the performance benefit of hybrid memory system on HPC environments2017Ingår i: Proceedings - 2017 IEEE 31st International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2017, Institute of Electrical and Electronics Engineers (IEEE), 2017, s. 683-692, artikel-id 7965110Konferensbidrag (Refereegranskat)
    Abstract [en]

    Hardware accelerators have become a de-facto standard to achieve high performance on current supercomputers and there are indications that this trend will increase in the future. Modern accelerators feature high-bandwidth memory next to the computing cores. For example, the Intel Knights Landing (KNL) processor is equipped with 16 GB of high-bandwidth memory (HBM) that works together with conventional DRAM memory. Theoretically, HBM can provide ∼4× higher bandwidth than conventional DRAM. However, many factors impact the effective performance achieved by applications, including the application memory access pattern, the problem size, the threading level and the actual memory configuration. In this paper, we analyze the Intel KNL system and quantify the impact of the most important factors on the application performance by using a set of applications that are representative of scientific and data-analytics workloads. Our results show that applications with regular memory access benefit from MCDRAM, achieving up to 3× performance when compared to the performance obtained using only DRAM. On the contrary, applications with random memory access pattern are latency-bound and may suffer from performance degradation when using only MCDRAM. For those applications, the use of additional hardware threads may help hide latency and achieve higher aggregated bandwidth when using HBM.

  • 198.
    Peng, I. Bo
    et al.
    KTH, Skolan för datavetenskap och kommunikation (CSC), Beräkningsvetenskap och beräkningsteknik (CST).
    Markidis, Stefano
    KTH, Skolan för datavetenskap och kommunikation (CSC), Beräkningsvetenskap och beräkningsteknik (CST).
    Laure, Erwin
    KTH, Skolan för datavetenskap och kommunikation (CSC), Beräkningsvetenskap och beräkningsteknik (CST).
    Kestor, G.
    Gioiosa, R.
    Exploring Application Performance on Emerging Hybrid-Memory Supercomputers2017Ingår i: Proceedings - 18th IEEE International Conference on High Performance Computing and Communications, 14th IEEE International Conference on Smart City and 2nd IEEE International Conference on Data Science and Systems, HPCC/SmartCity/DSS 2016, Institute of Electrical and Electronics Engineers (IEEE), 2017, s. 473-480, artikel-id 7828415Konferensbidrag (Refereegranskat)
    Abstract [en]

    Next-generation supercomputers will feature more hierarchical and heterogeneous memory systems with different memory technologies working side-by-side. A critical question is whether at large scale existing HPC applications and emerging data-analytics workloads will have performance improvement or degradation on these systems. We propose a systematic and fair methodology to identify the trend of application performance on emerging hybrid-memory systems. We model the memory system of next-generation supercomputers as a combination of 'fast' and 'slow' memories. We then analyze performance and dynamic execution characteristics of a variety of workloads, from traditional scientific applications to emerging data analytics to compare traditional and hybrid-memory systems. Our results show that data analytics applications can clearly benefit from the new system design, especially at large scale. Moreover, hybrid-memory systems do not penalize traditional scientific applications, which may also show performance improvement.

  • 199.
    Peng, I. Bo
    et al.
    KTH, Skolan för datavetenskap och kommunikation (CSC), Beräkningsvetenskap och beräkningsteknik (CST).
    Markidis, Stefano
    KTH, Skolan för datavetenskap och kommunikation (CSC), Beräkningsvetenskap och beräkningsteknik (CST).
    Laure, Erwin
    KTH, Skolan för datavetenskap och kommunikation (CSC), Beräkningsvetenskap och beräkningsteknik (CST).
    Kestor, G.
    Gioiosa, R.
    Idle period propagation in message-passing applications2017Ingår i: Proceedings - 18th IEEE International Conference on High Performance Computing and Communications, 14th IEEE International Conference on Smart City and 2nd IEEE International Conference on Data Science and Systems, HPCC/SmartCity/DSS 2016, Institute of Electrical and Electronics Engineers (IEEE), 2017, s. 937-944, artikel-id 7828475Konferensbidrag (Refereegranskat)
    Abstract [en]

    Idle periods on different processes of Message Passing applications are unavoidable. While the origin of idle periods on a single process is well understood as the effect of system and architectural random delays, yet it is unclear how these idle periods propagate from one process to another. It is important to understand idle period propagation in Message Passing applications as it allows application developers to design communication patterns avoiding idle period propagation and the consequent performance degradation in their applications. To understand idle period propagation, we introduce a methodology to trace idle periods when a process is waiting for data from a remote delayed process in MPI applications. We apply this technique in an MPI application that solves the heat equation to study idle period propagation on three different systems. We confirm that idle periods move between processes in the form of waves and that there are different stages in idle period propagation. Our methodology enables us to identify a self-synchronization phenomenon that occurs on two systems where some processes run slower than the other processes.

  • 200.
    Penolazzi, Sandro
    KTH, Skolan för informations- och kommunikationsteknik (ICT), Elektroniksystem.
    A System-Level Framework for Energy and Performance Estimation in System-on-Chip Architectures2011Doktorsavhandling, monografi (Övrigt vetenskapligt)
    Abstract [en]

    Shifting the design entry point up to the system level is the most important countermeasure adopted to manage the increasing complexity of SoCs. The reason is that decisions taken at this level, early in the design cycle, have the greatest impact on the final design in terms of performance, energy efficiency and silicon area occupation. However, taking decisions at this level is very difficult, since the design space is extremely wide, and it has so far been mostly a manual activity. Efficient system-level estimation tools are therefore necessary to enable proper design-space exploration and the development of system-level synthesis tools.

    Proposing an efficient approach to system-level estimation is the main contribution of this thesis.

    The approach consists of three layers. The bottom layer relies on building a library of IP energy and performance models, where each IP functionality is pre-characterized. Characterization is done only once at the gate level, which gives high accuracy to the approach. The implementation of an energy and performance model for a Leon3 processor is reported as an example. The impact that the IP-to-IP communication infrastructure has over individual IP properties is also taken into account, for bus-based and NoC-based architectures.

    The intermediate layer is where the actual estimation takes place. At this level, applications are run and profiled on a development host (a common PC). This allows us to create a trace of the executed source code, which is then mapped to the assembly code of the target architecture. This operation allows a trace of target instructions to be indirectly built and confers high speed on the whole methodology. Once the target trace is inferred, energy and performance figures can be extracted by using the IP models from the bottom layer. To make the whole process possible, changes are made to the GNU GCC compiler. Estimation is shown for a few common image/video codec applications.

    The top layer is a refinement layer that accounts for the presence of caches and for the fact that multiple applications normally run concurrently, share the same resources and are controlled by an operating system. Statistical models are built to account for the impact of each of these components. An MPSoC hosting up to 15 processors and using both fixed-priority and round robin bus arbitration is used for modeling bus contention. The RTEMS operating system is taken as a reference to model the OS impact.

    Validation for each layer is also carried out. The results show that the approach is within 15% of gate-level accuracy and exhibits an average speed-up of 30X compared to transaction-level modeling (TLM).

    Ladda ner fulltext (pdf)
    FULLTEXT01
123456 151 - 200 av 287
RefereraExporteraLänk till träfflistan
Permanent länk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf