Being able to accurately forecast the time of arrival of a vehicle in traffic appeals both to private drivers aiming to keep up with their schedules, and to businesses that need to organize transport logistics. THis thesis is assigned by the Swedish truck manufacturer Scania CV AB, and sets out to use GPS data from Scania's vehicle fleet to train Machine LEarning models to predict the travel times of vehicles between stops. The predictive models implemented train on features engineered from quite simple information from the vehicles, yet reach high predictive accuracy in certain scenarios. Two approaches to predicting travel time are tested, one referred to as the Local Models approach, and the other as the Global Model approach. In the Local Models approach, many separate regressors are trained on geographical subsets of the datra and then comnbined to give global predictions. In the Global Model approach, a single regressor trains on the entire data set. The Global Model approch gives better performance than that of the Local Models in the experiment, but the Local Models approach shows some promising tendencies. It is found that a regressor predicts significantly more accurately when the geographical spread of the data is limited.
Att ge noggranna förutsager om restider för fordon i trafik är av intresse både för privata förare som försöker hinna med sina scheman, och företag som behöver organiska logistik för transporter. Denna rapport görs på uppdrag av svenska lastbilstillverkaren Scania CV AB, och har som mål att använda GPS-data från Scanias fordon till att träna maskininlärningsmodeller för att förutsäga hur lång tid det tar för fordon att resa mellan stopp. De prediktiva modellerna som implementeras använder variabler som konstrueras från relativt enkel information från fordonen, men lyckas ändå nå hög prediktiv prestanda i vissa scenarion. Två olika ansatser prövas för att förutsäga restider, en ansats med lokala modeller, och en ansats med global modell. I ansatsen med lokala modeller tränas flera separata regressorer på geografiska delmängder av datan, vilka sedan kombineras och ger globala förutsägor. I ansatsen med global modell tränas en enda regressor på hela datamängden. Ansatsen med global modell visar sig ha högre prestanda i experimenten, men ansatsen med lokala modeller förevisar ändå vissa lovande tendenser. Resultaten antyder att en regressor ger mycket noggrannare prediktioner när den geografiska spridningen i datan begränsas.