Open this publication in new window or tab >>2021 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]
Mobile edge computing makes available distributed computation and stor-age resources in close proximity to end users and allows to provide low-latencyand high-capacity services within mobile networks. Therefore, mobile edgecomputing is emerging as a promising architecture for hosting critical ser-vices with stringent latency and performance requirements, which otherwiseare challenging to be addressed in conventional cloud computing architectures.Notable use cases of mobile edge computing include real-time data analyticservices, industrial process control, and computation offloading for Internetof things devices. However, those services rely on efficient resource manage-ment, including resource dimensioning and service placement, and require tobe resilient to cyber-attacks, to faulty components and to operation mistakes.The work in this thesis proposes models of resilient resource management thatsupport rapid response to incidents in mobile edge computing and developsefficient algorithms for the resulting resource management problems.
In the first part of the thesis, we consider resilient resource managementfor edge computing systems in which failover is realized by restoring additionalservice instances in different mobile edge computing nodes in case of failures.We first develop a placement algorithm based on Benders decomposition andlinear relaxation to determine the mobile edge computing nodes to be openedand to compute the placement of the service instances with respect to a set ofconsidered failure scenarios, with the objective of minimizing operation costs.Upon the occurrence of a failure scenario, service migration is to be triggeredto migrate the service instances from one placement to another placement, forwhich we further develop service migration algorithms to schedule migrationunder time constraints, so as to minimize service interruptions.
In the second part of the thesis, we consider resilient resource manage-ment in mobile edge computing for services with different levels of resiliencerequirements. Resilience is achieved by synchronizing states of the servicesto two types of standby instances that maintain the trade-off between en-ergy consumption and activation time such that the standby instances cantake over the service seamlessly as an instantaneous failure response. We for-mulate the joint problem of resource dimensioning and service placement forminimizing energy consumption and prove that it is NP-hard. We propose anefficient approximation algorithm based on Lagrangian relaxation to decidethe type, amount, and locations of the computation resources and to com-pute the placement of service instances and their standby instances. We thenconsider the same resilience model but for hosting periodic services in mo-bile edge computing systems with resources portioned into availability zones,under schedulability constraints. We formulate the corresponding resilient re-source management problem as a non-linear programming problem and provethat it is NP-hard. We propose efficient solutions based on approximationprogramming and primal-dual approaches for resilient service placement.
By considering different models of resilient service placement in mobileedge computing, the results in this thesis provide effective, efficient, and scal-able resource management algorithms for emerging mobile edge computingsystems.
Abstract [sv]
Databehandling i det mobila nätverkets utkant (mobile edge computing) innebär att distribuerade beräknings- och lagringsresurser tillgängliggörs direkt i infrastrukturen för det mobila nätverket. Den fysiska närheten till slutanvändarna gör det möjligt att tillhandahålla tjänster med liten fördröjning och hög kapacitet. Därför växer nu teknologin fram som ett lovande alternativ till molnberäkning, särskilt för att driva kritiska tjänster med strikta krav på fördröjning och prestanda som är svåra att uppfylla i traditionella molnberäkningssystem. Några exempel på viktiga tillämpningsområden är tjänster för dataanalys som måste köras i realtid, styrning av industriprocesser, samt avlastning av beräkningsintensiva uppgifter från sakernas-internet-enheter. Denna typ av system ställer dock höga krav på effektiv hantering av resurser, vilket innefattar att tilldela rätt mängd resurser och att avgöra var i nätverket en tjänst ska köras. Dessutom ställs höga krav på resiliens mot cyberattacker, felande komponenter, samt driftfel. Arbetet i denna avhandling lägger fram modeller för resilient resurshantering för databehandling i nätverkets utkant, som kan ställa om snabbt i händelse av fel, samt utvecklar effektiva algoritmer för att optimera hanteringen av resurser i dessa modeller. I avhandlingens första del studeras en mekanism för resilient resurshantering i system för databearbetning i nätverkets utkant, som i händelse av fel initierar nya instanser av den felande tjänsten i andra beräkningsnoder och återställer tjänsten. En algoritm utvecklas, baserad på Benders dekomposition och relaxation, som tar hänsyn till flera olika felscenarier för att avgöra vilka beräkningsnoder som skall användas och var de nya tjänsteinstanserna skall köras, med målet att minimera driftskostnaderna. Därutöver utvecklas algoritmer för schemaläggning av migration av tjänster från en beräkningsnod till en annan, i den händelse att ett felscenario inträffar, som tar hänsyn till tidsbegränsningar och har som mål att minimera avbrott i aktiva tjänster.
I avhandlingens andra del studeras resilient resurshantering då olika tjänster har olika krav på resiliensnivå. Resiliens uppnås genom att synkronisera tillstånden hos de tjänster som är i drift med två olika typer av ”standby”-instanser som är i viloläge och redo att ögonblickligen och sömlöst ta över efter en felande tjänsteinstans. Ett problem formuleras, samt bevisas vara NP-svårt, för att samtidigt optimera både tilldelning av resurser och av beräkningsnoder till tjänsterna, med målet att minimera energiåtgång.
En effektiv algoritm, baserad på Lagrangerelaxation, ges för att hitta en approximativ lösning till problemet, det vill säga för att avgöra typ, mängd och placering av de nödvändiga beräkningsresurserna, samt placering av tjänsteinstanser och deras respektive ”standby”-instanser. Dessutom utvidgas modellen till tjänster som måste köras periodiskt och för att inkludera resurser som är tillgängliga endast i vissa zoner, med begränsningar för schemaläggning av tjänster. Ett icke-linjärt optimeringsproblem formuleras för att lösa detta schemaläggningsproblem och bevisas vara NP-svårt. En effektiv lösningsmetod utvecklas, med hjälp av approximationsmetoder och primal-dual-metoder, för resilient nodplacering av tjänster.
Avhandlingen överväger flera olika modeler för resilient resurshantering, det vill säga för att besluta hur tjänster ska delas upp mellan olika noder i nätverkets utkant, samt lägger fram effektiva och skalbara algoritmer för att optimera resurshantering i framtidens databearbetningssystem i det mobila nätverkets utkant.
Place, publisher, year, edition, pages
Stockholm: KTH Royal Institute of Technology, 2021
Series
TRITA-EECS-AVL ; 2021:20
National Category
Communication Systems Computer Sciences
Research subject
Electrical Engineering
Identifiers
urn:nbn:se:kth:diva-291859 (URN)978-91-7873-816-8 (ISBN)
Public defence
2021-04-15, Online/ Kollegiesalen, , Brinellvägen 8, KTH Campus,, 13:00 (English)
Opponent
Supervisors
Note
QC 20210322
2021-03-222021-03-202022-06-25Bibliographically approved