Safe Exploration for Non-linear Systems: A Data-Driven Framework for Safe Data Collection in Nonlinear Systems
2025 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Säker utforskning av icke-linjära system : Ett datadrivet ramverk för säker datainsamling i icke-linjära system (Swedish)
Abstract [en]
We present a framework that enables autonomous systems to collect rich, informative data from partially unknown nonlinear plants while strictly respecting stability and hard state–input constraints. Starting from a stabilisable linear approximation, the unmodelled residual dynamics are learned on-line with Gaussian-process (GP) regression, which delivers both a mean estimate and high-confidence variance envelopes. These uncertainty bounds are embedded in a probabilistic control-invariant set (PCIS) that contracts the state space to a region where every state is guaranteed to remain safe with probability 1 − 𝛿. At each sampling instant a small quadratic programme selects the control input that (i) keeps the state inside the PCIS, (ii) tracks the nominal stabilising input as closely as possible, and (iii) actively excites poorly modelled directions so that the GP posterior variance shrinks over time. As learning progresses the PCIS expands automatically, allowing progressively more aggressive exploration without sacrificing guarantees. The framework is validated on two benchmarks of increasing complexity: (a) a two-state, unstable polynomial system and (b) a laboratory three-tank process with multi-input actuation and water-level constraints.
Abstract [sv]
Vi presenterar ett ramverk som gör det möjligt för autonoma system att samla rik och informativ data från delvis okända, olinjära processer samtidigt som stabilitet och hårda tillstånds- och insatsbegränsningar strikt upprätthålls. Utgångspunkten är en stabiliserbar linjär approximation; den omodellerade residualdynamiken lärs on-line med Gaussisk process-regression (GP), som ger både en medelvärdesskattning och högkonfidensintervall för variansen. Dessa osäkerhetsgränser integreras i en probabilistisk kontrollinvariant mängd (PCIS) som begränsar tillståndsrymden till ett område där varje tillstånd garanteras vara säkert med sannolikhet 1 − 𝛿. Vid varje provtagningsögonblick löser ett litet kvadratiskt program följande uppgift: (i) hålla tillståndet inom PCIS, (ii) följa det nominella stabiliserande styrsignalet så nära som möjligt, och (iii) aktivt excitera dåligt modellerade riktningar så att GP-posterns varians minskar över tid. Allteftersom inlärningen fortskrider expanderar PCIS automatiskt, vilket möjliggör allt mer aggressiv utforskning utan att garantierna offras. Ramverket valideras på två testfall av stigande komplexitet: (a) ett tvåtillståndigt, instabilt polynomsystem och (b) en laboratorieuppställning med tre sammankopplade tankar, flerports aktivering och nivåbegränsningar för vattennivån.
Place, publisher, year, edition, pages
2025. , p. 83
Series
TRITA-EECS-EX ; 2025:940
Keywords [en]
Safe Exploration, Nonlinear Systems, Gaussian Processes, Probabilistic Control Invariant Sets, Control Lyapunov Functions
Keywords [sv]
Säker Utforskning, Icke-linjära System, Gaussiska Processer, Sannolikhetsbaserade Kontrollinvarianta Mängder, Lyapunov-funktioner för Styrning
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-377006OAI: oai:DiVA.org:kth-377006DiVA, id: diva2:2040203
External cooperation
ABB Corporate Research
Supervisors
Examiners
2026-02-272026-02-192026-02-27Bibliographically approved