kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Probabilistic Generative Models and Markov Chains for Analyzing Availability vs. Power & Cooling Infrastructure Costs of Edge Clouds
KTH, School of Engineering Sciences (SCI), Mathematics (Dept.), Mathematical Statistics.
2021 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Probabilistiska generativa modeller och Markovprocesser för analys av tillgänglighet gentemot kostnader för elkraftförsörjning och kylsystem hos Edge Cloud (Swedish)
Abstract [en]

Recent advances in IT have led to the proliferation of new applications in the transportation, healthcare, mining, security, and entertainment sectors. The emerging applications have stringent requirements for latency and availability. For a cloud provider, one of the biggest challenges is to be able to guarantee that those requirements are met while minimizing operational cost.

To satisfy the requirements, the currently implemented solution is to host the cloud services in large, centralized data centers. These have multiple redundant power and cooling systems which, although costly, lead to requirements of availability being met. However, due to the centralized data center's large distance to the user, requirements for latency are sometimes not satisfied when using this approach.

Another solution is to move computing capabilities closer to the end-users by deploying a geo-distributed set of smaller data centers, Edge Clouds, near the Mobile Network Operator's (MNO's) already existing sites. The requirements for latency would thus be met more easily. However, whether the requirement for the availability of the distributed network of Edge Clouds will be satisfied depends on, for instance, which level of redundancy the power and cooling systems have in the Edge Clouds. It also depends on how many routes there are for an Edge Cloud to gain access to computing capabilities which is related to the concept of data replication.

If a particular network topology has a considerably higher availability than that which is required, an MNO could consider decreasing the redundancy of the power and cooling systems in the Edge Clouds. This would lead to an increased cost-efficiency of resources.

This master thesis in mathematical statistics addresses the above-mentioned problem and studies the possibilities of using Probabilistic Generative Models and Continuous Time Markov Chains to solve it. Availability of one Edge Cloud and a geo-distributed Edge Cloud topology is calculated for four different redundant configurations of cooling and power systems. A sensitivity analysis based on the mean time to component failure and the mean time it takes for a repairperson to travel to an Edge Cloud is performed for each of the configurations.

The results show that availability of a topology which consists of 70 Edge Clouds, 91 links and six core data centers is less than that of a Tier IV centralized data center (0.99995). This holds even if the power supply modules and cooling systems of the Edge Clouds in the topology are fully redundant and each Edge Cloud has an Uninterruptible Power Supply (UPS) unit. To achieve a higher availability, data needs to be replicated in some of the Edge Clouds.

Furthermore, the results indicate that availability of the geo-distributed Edge Cloud topology is more sensitive to changes which regard using UPS units, as opposed to when the redundancy level of the power supply module and cooling system is altered. Hence, capital spent on increasing redundancy for power supply modules and cooling systems could instead be allocated to using UPS units.

Abstract [sv]

Nya framsteg inom IT har lett till flertalet nya applikationer inom områden som till exempel transport, sjukvård, gruvdrift, säkerhet och underhållning. De nya applikationerna har allt strängare krav på latens och tillgänglighet. En av de största utmaningarna för ett företag som erbjuder cloud-tjänster är att garantera att dessa krav uppfylls samtidigt som driftkostnader minimeras.

För att uppfylla kraven används för nuvarande stora, centraliserade, datacenter. Dessa har många redundanta system för elkraftförsörjning och kylning som, även fast de är kostsamma, leder till att kravet på tillgänglighet uppfylls. Dock uppfylls inte alltid kravet på latens med denna lösning eftersom avståndet mellan det centraliserade datacentret och användaren ofta är stort.

En annan lösning är att förflytta beräkningskapacitet närmare användaren genom att distribuera ett antal mindre datacenter, Edge Clouds, vid de bas-stationer som en mobiloperatör redan har satt upp. Detta skulle leda till att kravet på latens lättare uppfylls. Huruvida kravet på tillgänglighet för nätverket av Edge Clouds uppfylls beror dock på, exempelvis, hur redundanta systemen för elkraftförsörjning och kylning är. Det beror också på hur många olika sätt det finns för ett Edge Cloud att få tillgång till beräkningskapacitet och data, vilket är relaterat till konceptet om replikering av tillstånd.

Om en särskild nätverkstopologi har en tillgänglighet som är betydligt högre än det som behövs, kan en mobiloperatör överväga att minska redundansnivån för elkraftförsörjning och kylsystem. Detta skulle leda till en ökad kostnadseffektivitet.

Detta masterexamensarbete inom matematisk statistik behandlar det ovannämnda problemet och studerar möjligheter kring att använda probabilistiska generativa modeller och Markovprocesser för att lösa det. Tillgängligheten för ett Edge Cloud och ett nätverk av Edge Clouds beräknas för fyra olika redundanta konfigurationer av elkraftförsörjning och kylsystem. För varje konfiguration genomförs en känslighetsanalys som baseras på tiden det tar till att ett fel uppstår i respektive komponent och hur lång tid det tar för en reparatör att resa till ett Edge Cloud.

Resultaten visar att tillgängligheten för en nätverkstopologi som består av 70 Edge Cloud, 91 länkar och sex core datacenter är mindre än tillgängligheten för ett Tier IV datacenter (0,99995). Detta gäller även om strömförsörjningsmoduler och kylsystem är redundanta och respektive Edge Cloud har en avbrottsfri strömförsörjning (UPS). För att öka tillgängligheten krävs det att data replikeras mellan vissa Edge Cloud.

Dessutom tyder resultaten på att tillgängligheten för nätverkstopologin är mer känslig för ändringar som avser användandet av avbrottsfri strömförsörjning än för olika konfigurationer av strömförsörjningsmoduler och kylsystem. Det kan därmed konstateras att kapital som spenderas på att öka redundans av strömförsörjningsmoduler och kylsystem istället kan allokeras till användande av avbrottsfri strömförsörjning.

Place, publisher, year, edition, pages
2021. , p. 156
Series
TRITA-SCI-GRU ; 2021:191
Keywords [en]
Mathematical Statistics, Probabilistic Generative Models, Continuous Time Markov Chains, Edge Cloud, Power Cost, Cooling Cost
Keywords [sv]
Matematisk Statistik, Probabilistiska Generativa Modeller, Markovprocesser, Edge Cloud, Kostnader för kylsystem, Kostnader för elkraftsförsörjning
National Category
Probability Theory and Statistics
Identifiers
URN: urn:nbn:se:kth:diva-310115OAI: oai:DiVA.org:kth-310115DiVA, id: diva2:1645990
External cooperation
Ericsson AB
Subject / course
Mathematical Statistics
Educational program
Master of Science - Mathematics
Supervisors
Examiners
Available from: 2022-03-21 Created: 2022-03-21 Last updated: 2022-06-25Bibliographically approved

Open Access in DiVA

No full text in DiVA

By organisation
Mathematical Statistics
Probability Theory and Statistics

Search outside of DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric score

urn-nbn
Total: 597 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf