kth.sePublikationer
Ändra sökning
Länk till posten
Permanent länk

Direktlänk
Publikationer (7 of 7) Visa alla publikationer
Hultin, H., Hult, H., Proutiere, A., Samama, S. & Tarighati, A. (2024). A deterministic policy gradient method for order execution and option hedging in the presence of market impact. Journal of Financial Data Science, 6(3), 81-114
Öppna denna publikation i ny flik eller fönster >>A deterministic policy gradient method for order execution and option hedging in the presence of market impact
Visa övriga...
2024 (Engelska)Ingår i: Journal of Financial Data Science, ISSN 2640-3943, Vol. 6, nr 3, s. 81-114Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

In this article, an iterative deterministic policy gradient method for finding optimal strategies in the presence of market impact is introduced. The derivation of the policy gradient sheds light on a proper way of handling the market impact of trades in the context of reinforcement learning. Similar to many machine learning methods, the proposed deterministic policy gradient method is based on mini-batch stochastic gradient descent optimization. The method is demonstrated to consistently perform well for several different objectives and market dynamics when applied to the financial applications of order execution and option hedging.

Ort, förlag, år, upplaga, sidor
With Intelligence LLC, 2024
Nationell ämneskategori
Beräkningsmatematik
Identifikatorer
urn:nbn:se:kth:diva-353470 (URN)10.3905/jfds.2024.1.164 (DOI)2-s2.0-85202532970 (Scopus ID)
Anmärkning

QC 20240924

Tillgänglig från: 2024-09-19 Skapad: 2024-09-19 Senast uppdaterad: 2024-11-20Bibliografiskt granskad
Hultin, H. (2024). Topics on Machine Learning for Algorithmic Trading. (Doctoral dissertation). Stockholm: KTH Royal Institute of Technology
Öppna denna publikation i ny flik eller fönster >>Topics on Machine Learning for Algorithmic Trading
2024 (Engelska)Doktorsavhandling, sammanläggning (Övrigt vetenskapligt)
Abstract [en]

Recent advancements in machine learning have opened up new possibilities for algorithmic trading, enabling the optimization of trading strategies in complex market environments. This thesis aims to improve algorithmic trading methods by developing machine learning models for the realistic simulation of limit order books and the learning of optimal strategies. Consisting of three papers, the thesis combines theoretical insights with practical applications.

The first paper presents a generative model for the dynamic evolution of a limit order book, using recurrent neural networks. The model captures the complete dynamics of the limit order book by decomposing the probability of each transition of the limit order book into a product of conditional probabilities for order type, price level, order size, and time delay. Each of these conditional probabilities is modeled by a recurrent neural network. Additionally, the paper introduces several evaluation metrics for generative models related to order execution. The generative model is trained on both synthetic data generated by a Markov model and real data from the Nasdaq Stockholm exchange.

The second paper proposes an iterative deterministic policy gradient method for stochastic control problems in finance, which incorporates both temporary and permanent market impact. The method is based on a derived policy gradient theorem and uses mini-batch stochastic gradient descent for optimization. It is applied to both order execution and option hedging, demonstrating consistently strong performance across several objectives and market dynamics. 

The third paper studies a policy gradient method with parameter-based exploration, where a single deterministic policy is sampled at the beginning of an episode and used throughout the whole episode. A marginal equivalence between parameter-based and action-based exploration is shown, facilitating the adaption of previously established convergence results for policy gradient methods with action-based exploration. Convergence rates to first-order stationary points are derived under mild assumptions, and global convergence is established under an introduced Fisher-non-degenerate condition for parameter-based exploration.

Abstract [sv]

Den senaste tidens framsteg inom maskininlärning har skapat nya förutsättningar för algoritmisk handel och möjliggjort optimering av handelsstrategier i komplexa miljöer. Syftet med denna avhandling är att förbättra metoder för algorithmisk handel genom att utveckla modeller baserade på maskininlärning för realistisk simulering av orderböcker samt för lärande av optimala strategier. Avhandlingen består av tre artiklar och kombinerar teoretiska insikter med praktiska tillämpningar.

Den första artikeln utvecklar en generativ modell för den dynamiska utvecklingen av en orderbok baserad på rekurrenta neurala nätverk. Modellen fångar orderbokens fullständiga dynamik genom att bryta ner sannolikheten för varje förändring av orderboken i en produkt av betingade sannolikheter för ordertyp, prisnivå, orderstorlek och tidsfördröjning. Var och en av dessa betingade sannolikheter modelleras med ett rekurrent neuralt nätverk. Dessutom introducerar artikeln flera evalueringsmetoder för generativa modeller relaterade till orderexekvering. Den generativa modellen tränas framgångsrikt både för syntetisk data, genererad av en Markovmodell, och verklig data från Nasdaq Stockholm.

Den andra artikeln föreslår en iterativ deterministisk policygradientmetod för stokastiska kontrollproblem inom finans, som inkluderar både temporär och permanent marknadspåverkan. Metoden är baserad på ett härlett policy gradient teorem och använder stokastisk gradientnedstigning för optimering. Den tillämpas framgångsrikt på både orderexekvering och optionshedging och visar konsekvent bra resultat för varierande objektiv och marknadsdynamik.

Den tredje artikeln studerar en policygradientmetod med parameterbaserad utforskning, där en enda deterministisk policy väljs slumpmässigt i början av en episod och används under hela episoden. En ekvivalens mellan parameterbaserad och handlingsbaserad utforskning visas, vilket möjliggör anpassning av tidigare etablerade konvergensresultat för policygradientmetoder med handlingsbaserad utforskning. Konvergenshastigheter till första ordningens stationära punkter härleds under milda antaganden, och global konvergens etableras under ett introducerat villkor gällande Fisher-icke-degenerering för parameterbaserad utforskning.

Ort, förlag, år, upplaga, sidor
Stockholm: KTH Royal Institute of Technology, 2024. s. 251
Serie
TRITA-SCI-FOU ; 2024:55
Nationell ämneskategori
Sannolikhetsteori och statistik
Forskningsämne
Tillämpad matematik och beräkningsmatematik; Tillämpad matematik och beräkningsmatematik, Matematisk statistik
Identifikatorer
urn:nbn:se:kth:diva-356595 (URN)978-91-8106-126-0 (ISBN)
Disputation
2024-12-16, F3, Lindstedtsvägen 26, Stockholm, 14:00 (Engelska)
Opponent
Handledare
Forskningsfinansiär
Wallenberg AI, Autonomous Systems and Software Program (WASP)
Anmärkning

QC 2024-11-20

Tillgänglig från: 2024-11-20 Skapad: 2024-11-20 Senast uppdaterad: 2024-12-03Bibliografiskt granskad
Hultin, H., Hult, H., Proutiere, A., Samama, S. & Tarighati, A. (2023). A generative model of a limit order book using recurrent neural networks. Quantitative finance (Print), 23(6), 931-958
Öppna denna publikation i ny flik eller fönster >>A generative model of a limit order book using recurrent neural networks
Visa övriga...
2023 (Engelska)Ingår i: Quantitative finance (Print), ISSN 1469-7688, E-ISSN 1469-7696, Vol. 23, nr 6, s. 931-958Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

In this work, a generative model based on recurrent neural networks for the complete dynamics of a limit order book is developed. The model captures the dynamics of the limit order book by decomposing the probability of each transition into a product of conditional probabilities of order type, price level, order size and time delay. Each such conditional probability is modelled by a recurrent neural network. Several evaluation metrics for generative models related to trading execution are introduced. Using these metrics, it is demonstrated that the generative model can be successfully trained to fit both synthetic and real data from the Nasdaq Stockholm exchange.

Ort, förlag, år, upplaga, sidor
Informa UK Limited, 2023
Nyckelord
Generative modelling, High-frequency trading, Limit order book, Machine learning, Recurrent neural networks
Nationell ämneskategori
Annan matematik
Identifikatorer
urn:nbn:se:kth:diva-331547 (URN)10.1080/14697688.2023.2205583 (DOI)000993312600001 ()2-s2.0-85159899205 (Scopus ID)
Anmärkning

QC 20230711

Tillgänglig från: 2023-07-11 Skapad: 2023-07-11 Senast uppdaterad: 2024-11-20Bibliografiskt granskad
Hultin, H., Hult, H., Proutiere, A., Samama, S. & Tarighati, A.A generative model of a limit order book using recurrent neural networks.
Öppna denna publikation i ny flik eller fönster >>A generative model of a limit order book using recurrent neural networks
Visa övriga...
(Engelska)Manuskript (preprint) (Övrigt vetenskapligt)
Nationell ämneskategori
Sannolikhetsteori och statistik Beräkningsmatematik
Identifikatorer
urn:nbn:se:kth:diva-295414 (URN)
Anmärkning

QC 20210531

Tillgänglig från: 2021-05-20 Skapad: 2021-05-20 Senast uppdaterad: 2022-06-25Bibliografiskt granskad
Poklukar, P., Ceylan, C., Hultin, H., Kravchenko, O., Varava, A. & Kragic, D.GraphDCA - a Framework for Node Distribution Comparison in Real and Synthetic Graphs.
Öppna denna publikation i ny flik eller fönster >>GraphDCA - a Framework for Node Distribution Comparison in Real and Synthetic Graphs
Visa övriga...
(Engelska)Manuskript (preprint) (Övrigt vetenskapligt)
Abstract [en]

We argue that when comparing two graphs, the distribution of node structural features is more informative than global graph statistics which are often used in practice, especially to evaluate graph generative models. Thus, we present GraphDCA - a framework for evaluating similarity between graphs based on the alignment of their respective node representation sets. The sets are compared using a recently proposed method for comparing representation spaces, called Delaunay Component Analysis (DCA), which we extend to graph data. To evaluate our framework, we generate a benchmark dataset of graphs exhibiting different structural patterns and show, using three node structure feature extractors, that GraphDCA recognizes graphs with both similar and dissimilar local structure. We then apply our framework to evaluate three publicly available real-world graph datasets and demonstrate, using gradual edge perturbations, that GraphDCA satisfyingly captures gradually decreasing similarity, unlike global statistics. Finally, we use GraphDCA to evaluate two state-of-the-art graph generative models, NetGAN and CELL, and conclude that further improvements are needed for these models to adequately reproduce local structural features.

Nyckelord
Representation Learning, Machine Learning, Graph Generative Models, Node Embeddings
Nationell ämneskategori
Datavetenskap (datalogi)
Identifikatorer
urn:nbn:se:kth:diva-312720 (URN)
Anmärkning

QC 20220614

Tillgänglig från: 2022-05-20 Skapad: 2022-05-20 Senast uppdaterad: 2022-06-25Bibliografiskt granskad
Hultin, H., Hult, H. & Proutiere, A.On the convergence of policy gradients with parameter-based exploration.
Öppna denna publikation i ny flik eller fönster >>On the convergence of policy gradients with parameter-based exploration
(Engelska)Manuskript (preprint) (Övrigt vetenskapligt)
Abstract [en]

We analyze the convergence of the Policy Gradient algorithm with Parameter-based Exploration (PGPE). This algorithm employs a parameterized sampling procedure to select a deterministic policy at the beginning of each episode, which is then executed throughout the episode. The parameter is updated using stochastic gradient ascent. A key advantage of PGPE over other policy gradient methods is its ability to learn optimal deterministic policies without requiring any smoothness assumptions on these policies (e.g., it can learn optimal threshold-based policies). We investigate the convergence rate of PGPE to a stationary point under mild assumptions on the class of sampling procedures. This rate is illustrated for sampling procedures using specific types of parameterizations, including product, softmax, and Gaussian parameterizations. Finally, we extend the Fisher-non-degenerate condition, used in earlier work for action-based policies, to PGPE sampling procedures and demonstrate that under this condition, PGPE attains an ϵ-optimal stationary point with a sample complexity scaling as Õ(ϵ−3).

Nationell ämneskategori
Sannolikhetsteori och statistik
Forskningsämne
Tillämpad matematik och beräkningsmatematik; Tillämpad matematik och beräkningsmatematik, Matematisk statistik
Identifikatorer
urn:nbn:se:kth:diva-356594 (URN)
Forskningsfinansiär
Wallenberg AI, Autonomous Systems and Software Program (WASP)
Anmärkning

QCR 20241120

Tillgänglig från: 2024-11-19 Skapad: 2024-11-19 Senast uppdaterad: 2024-11-20Bibliografiskt granskad
Hultin, H., Hult, H., Proutiere, A., Samama, S. & Tarighati, A.Reinforcement learning for optimal execution in high resolution Markovian limit order book models.
Öppna denna publikation i ny flik eller fönster >>Reinforcement learning for optimal execution in high resolution Markovian limit order book models
Visa övriga...
(Engelska)Manuskript (preprint) (Övrigt vetenskapligt)
Nationell ämneskategori
Beräkningsmatematik
Identifikatorer
urn:nbn:se:kth:diva-295423 (URN)
Anmärkning

QC 20210531

Tillgänglig från: 2021-05-20 Skapad: 2021-05-20 Senast uppdaterad: 2022-06-25Bibliografiskt granskad
Organisationer
Identifikatorer
ORCID-id: ORCID iD iconorcid.org/0000-0002-0067-4908

Sök vidare i DiVA

Visa alla publikationer