Open this publication in new window or tab >>2025 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]
The fifth generation mobile networks has become the new network standard, with the sixth generation on the horizon, and its new technological capabilities have enabled a far wider variety of services compared to the fourth generation networks. To ensure that these services can co-exist and meet their standardized requirements, the network's resources must be provisioned, managed and reconfigured in a far more complex manner than before. As such, it is no longer sufficient to select a simple, static scheme for gathering the necessary information to take decisions. Instead, it is necessary to adaptively, with regards to network system dynamics, trade-off the cost in terms of power, CPU and bandwidth consumption of the taken measurements to the value their information brings. Network optimization is a wide field, and the way to quantify the value of a given measurement heavily depends on the problem studied. As such, this thesis addresses adaptive measurement schemes for a number of well-defined network optimization problems. The thesis is presented as a compilation, where after an introduction detailing the background, purpose, problem formulation, and contributions of our work, we present a more detailed view of the use cases, the theoretical, technological and methodological background together with an outline of our results. Finally we go into even more detail about our work through the appended conference and journal papers.
First, we study the problem of optimal spectrum access for low priority services. We assume that the network manager has limited opportunities to measure the spectrum before assigning one (if any) resource block to the secondary service for transmission, and this measurement has a known cost attached to it. We study this framework through the lens of multi-armed bandits with multiple arm pulls per decision, a framework we call predictive bandits. We analyze such bandits and show a problem specific lower bound on their regret, as well as design an algorithm which meets this regret asymptotically, studying both the case where measurements are perfect and the case where the measurement has noise of known quantity. Studying a synthetic simulated problem, we find that it performs considerably better compared to a simple benchmark strategy.
Secondly, we study a variation of admission control where the controller must select one of multiple slices to enter a new service into. The agent does not know the resources available in the slices initially, and must instead measure these, subject to noise. Mimicking three commonly used admission control strategies, we study this as a best arm identification problem, where one or multiple arms is "correct" (the arm chosen by the strategy if it had full information). Through this framework, we analyze each strategy and devise sample complexity lower bounds, as well as algorithms that meet these lower bounds. In simulations with synthetic data, we show that our measurement algorithm can vastly reduce the number of required measurements compared to uniform sampling strategies.
Thirdly, we study a network monitoring system where the controller must detect sudden changes in system behavior such as batch traffic arrivals or handovers, in order to take future action. We study this through the lens of change point detection but argue that the classical framework is insufficient for capturing both physical time aspects such as delay as well as measurement costs independently, and present an alternative framework which decouples these, requiring more sophisticated monitoring agents. We show, both through theory and through simulation with both synthetic data and data from a 5G testbed, that such adaptive schedules qualitatively and quantitatively improve upon classical change point detection schemes in terms of measurement frequency, without losing classical optimality guarantees such as the one on required measurements post change, and can do so even when very little is information a priori about the distribution of measurements post-change.
Finally, we combine the problems of dynamic spectrum access and change monitoring by studying change detection in a finite-state Markov chain model, with the two-state model as an interesting special case. Here, both classical methods as well as our methods from the case of independent measurements are insufficient to capture the complexities of the problem. We show fundamental limits of measurements on any agent in this case and study two heuristic policies, showing their advantages and disadvantages to both each other and a naive measurement strategy. Then, we evaluate their performance and measurement costs through simulation both with synthetic data and data from Wi-Fi spectrum utilization measurements.
Abstract [sv]
Femte generationens mobilnätverk har blivit den nya nätverksstandarden, med den sjätte generationen på horisonten, och dess teknologiska förmågor har berett väg för en avsevärt större variation av tjänster jämfört med fjärde generationens nätverk. För att se till att dessa tjänster kan samexistera och möta sina standardiserade krav måste nätverkens resurser provisioneras, hanteras och omkonfigureras på ett mycket mer komplext vis än tidigare. Det är därmed inte längre tillräckligt att välja en simpel, statisk plan för att samla den nödvändiga information som krävs för att ta beslut. Istället behöver man adaptivt, med hänsyn till nätversystemens dynamik, avväga mätningarnas kostnad i termer av effekt-, CPU- och bandbreddskonsumtion mot det värde som de medför. Den här sortens nätverksoptimering är ett brett fält, och hur mätningarnas värde ska kvantifieras beror i hög grad på vilket optimeringsproblem som studeras. Således bemöter den här avhandlningen adaptiva mätplaner för ett antal väldefinerade optimeringsproblem. Avhandlingen tar formen av en sammanlänkning, där följandes en introduktion som beskriver bakgrund, syfte, problemformulering och forskningsbidrag så presenterar vi en detaljbild över problemens användningsområde, deras teoretiska, teknologiska och metodologiska bakgrund samt våra resultat. Vi avslutare med att gå djupare in i varje problem separat genom de artiklar vi inlämnat till olika konferenser och journaler.
Först studerar vi optimal spektrumaccess för lågprioritetstjänster. Vi antar att nätverksregulatorn har begränsat med möjligheter att mäta spektrumanvändning innan den tillger som mest ett resursblock till tjänsten med lägre prioritet att skicka data på, och de här mätningarna har en känd kostnad. Vi studerar det här ramverket från perspektivet av flerarmade banditer med flera armdragningar per beslut, ett ramverk vi benämner förutsägande banditer (predictive bandits). Vi analyserar sådana banditer och visar en problemspecifik undre gräns på dess inlärningsförlust, samt designar en algorithm som presterar lika bra som denna gräns i den asymptotiska regimen. Vi studerar fallet där mätningarna är perfekta såväl som fallet där mätningarna har brus med känd storlek. Genom att studera ett syntetiskt simulerat problem av detta slag finner vi att vår algoritm presterar avsevärt bättre jämfört med en simplare riktmärkesstrategi.
Därefter studerar vi en variation av tillträdeskontroll, där en regulator måste välja en av ett antal betjänter att släppa in en ny tjänst till (om någon alls). Agenten vet ursprungligen inte vilka resurser som finns betjänterna tillgängliga, utan måste mäta detta med brusiga mätningar. Vi härmar tre vanligt använda tillträdesstrategier och studerar detta som ett bästa-arms identifieringsproblem, där en eller flera armar är "korrekta" (det vill säga, de armar som hade valts av tillträdesstrategin om den hade haft perfekt kännedom). Med det här ramverket analyserar vi varje strategi och visar undre gränser på antalet mätningar som krävs, och skapar algoritmer som möter dessa gränser. I simuleringar med syntetisk data visar vi att våra mätalgoritmer kan drastiskt reducera antalet mätningar som krävs jämfört med jämlika mätstrategier.
Efter det studerar vi ett övervakningssystem där agenten måste upptäcka plötsliga förändringar i systemets beteende såsom förändringar i trafiken eller överräckningar mellan master, för att kunna agera därefter. Vi studerar detta med ramverket förändringsdetektion, men argumenterar att det klassiska ramverket är otillräckligt för att bemöta aspekter berörande fysisk tid (som fördröjning) samtidigt som den bemöter mätningarnas kostnad. Vi presenterar därmed ett alternativt ramverk som frikopplar de två, vilket i sin tur kräver mer sostifikerade övervakningssystem. Vi visar, genom både teori och simulering med både syntetisk och experimentell data, att sådana adaptiva mätscheman kan förbättra mätfrekvensen jämfört med klassiska periodiska mätscheman, både kvalitativt och kvantitativt, utan att förlora klassiska optimalitetsgarantier såsom det på antalet mätningar som behövs när förändringen har skett. Vi visar också att de kan göra så även när väldigt lite information om mätningarnas distribution efter förändring är a priori känt för agenten.
Slutligen kombinerar vi problemen kring optimal spektrumaccess och \\övervakning genom att studera förändringsdetektion i en Markovkedjemodell med ändligt antal tillstånd, där två tillstånd är ett specialfall av särskilt intresse. I det fallet är både klassiska metoder och våra tidigare metoder otillräckliga för att fånga komplexiteterna i problemet. Vi härleder fundamentala gränser på mängden mätningar som alla agenteer behöver i det här fallet och studerar två heuristiska policier, där vi visar deras för- och nackdelar gentemot både varandra och en naiv mätstrategi. Därefter utvärderar vi deras prestanda och mätkostnader genom simulering med både syntetisk data såväl som data från spektrumanvändningsmätningar i Wi-Fi.
Place, publisher, year, edition, pages
Stockholm, Sweden: Kungliga Tekniska högskolan, 2025. p. 92
Series
TRITA-EECS-AVL ; 2025:20
Keywords
Network optimization, network management, multi-armed bandits, admission control, change point detection, statistical learning, telecommunication
National Category
Control Engineering
Research subject
Electrical Engineering
Identifiers
urn:nbn:se:kth:diva-360485 (URN)978-91-8106-192-5 (ISBN)
Public defence
2025-03-28, D3, Lindstedtsvägen 9, Stockholm, 10:00 (English)
Opponent
Supervisors
Funder
Wallenberg AI, Autonomous Systems and Software Program (WASP)
Note
QC 20250303
2025-03-032025-03-032025-03-03Bibliographically approved