kth.sePublications
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Trajectory Classification for Insect Biodiversity Monitoring: Comparing Feature-Based and End-to-End Sequence Models
KTH, School of Electrical Engineering and Computer Science (EECS).
2025 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Trajektorieklassificering för övervakning av insektbiodiversitet : Jämförelse av egenskapsbaserade och end-to-end-sekvensmodeller (Swedish)
Abstract [en]

Insect biodiversity is a key indicator of ecosystem health, yet vision-based monitoring often fails to capture tiny, fast-moving species under field conditions. An alternative approach is to classify insects based on their movement patterns, specifically their flight trajectories. This thesis investigates the classification of four species: honeybees, hoverflies (Syrphidae), butterflies (Lepidoptera) and wasps (Vespidae) using trajectory data captured at 30 frames per second. Two classification strategies were evaluated: feature-based models, which used extracted descriptors such as velocity as input, and sequence-based models, which processed raw x- and y-coordinate time series as input. An imbalanced dataset was used to train eight models: Decision Forest, Random Forest, Support Vector Machine (SVM), and XGBoost for the feature-based approach; and Convolutional Neural Network (CNN), 1-Nearest Neighbor Dynamic Time Warping (1NN-DTW), Long Short-Term Memory network (LSTM) and Random Convolutional Kernel Transform (ROCKET) for the sequence-based approach. The best sequence-based model, CNN, achieved 64% balanced accuracy, slightly outperforming the best feature-based model, SVM, which achieved 59%. However, SVM achieved a higher F1-macro score (0.54 vs. 0.51). Other sequence-based models, including ROCKET and the LSTM, underperformed relative to feature-based models. Notably, ROCKET obtained the lowest balanced accuracy (31%), an unexpected result that warrants further investigation. Overall, the findings demonstrate that sequence-based methods can match or exceed classical feature-based approaches for trajectory-based insect classification, but performance is highly dependent on the chosen model. Further evaluation of additional datasets, particularly with trajectories captured at a higher frame rate, is necessary to determine whether motion-based classification can effectively replace image-based biodiversity monitoring in field applications.

Abstract [sv]

Den biologiska mångfalden av insekter är en viktig indikator på ett ekosystems hälsa men bildbaserade övervakningssystem har ofta svårt att fånga flygande, små och snabbrörliga arter. Ett alternativt tillvägagångssätt är att klassificera insekter baserat på deras rörelsemönster, mer specifikt deras trajektorier (flygbanor). Den här studien undersöker klassificering av fyra arter: honungsbin, blomflugor (Syrphidae), fjärilar (Lepidoptera) och getingar (Vespidae) med hjälp av trajektoriedata fångat i 30 bildrutor per sekund. Två klassificeringsstrategier utvärderades: egenskapsbaserade modeller, som använde extraherade egenskaper såsom hastighet som indata, och sekvensbaserade modeller, som använde x- och y-koordinattidsserier som indata. Ett obalanserat dataset användes för att träna åtta modeller: Decision Forest, Random Forest, Support Vector Machine (SVM) och XGBoost för den egenskapsbaserade metoden; samt Convolutional Neural Network (CNN), 1-Nearest Neighbor Dynamic Time Warping (1NN-DTW), Long Short-Term Memory-nätverk (LSTM) och Random Convolutional Kernel Transform (ROCKET) för den sekvensbaserade metoden. Den bästa sekvensbaserade modellen, CNN, uppnådde 64% balanserad noggranhet och presterade något bättre än den bästa egenskapsbaserade modellen, SVM, som nådde 59%. SVM hade dock ett högre F1-macrovärde (0,54 jämfört med 0,51). Övriga sekvensbaserade modeller, inklusive ROCKET och LSTM, presterade sämre än de egenskapsbaserade modellerna. ROCKET uppnådde den lägsta balanserade noggranheten (31%) av samtliga modeller, vilket är anmärkningsvärt och motiverar vidare undersökning. Resultaten visar att sekvensbaserade metoder kan matcha eller överträffa klassiska egenskapsbaserade metoder för trajektoriebaserad insektsklassificering, men att prestandan är starkt beroende av den valda modellen. Ytterligare utvärdering på fler dataset, särskilt med trajektorier inspelade med högre bildfrekvens, är nödvändig för att avgöra om rörelsebaserad klassificering kan ersätta bildbaserad övervakning av biologisk mångfald.

Place, publisher, year, edition, pages
Stockholm: KTH Royal Institute of Technology , 2025. , p. 48
Series
TRITA-EECS-EX ; 2025:656
Keywords [en]
Insect biodiversity monitoring, Trajectory classification, Time-series classification, Feature-based classifiers, Sequence-based models
Keywords [sv]
Insektbiodiversitetsövervakning, Trajektorieklassificering, Tidsserieklassificering, Egenskapsbaserade klassificerare, Sekvensbaserademodeller
National Category
Computer Sciences Computer Engineering
Identifiers
URN: urn:nbn:se:kth:diva-371521OAI: oai:DiVA.org:kth-371521DiVA, id: diva2:2005891
Subject / course
Computer Science
Educational program
Master of Science - Computer Science
Supervisors
Examiners
Available from: 2025-10-30 Created: 2025-10-11 Last updated: 2025-10-30Bibliographically approved

Open Access in DiVA

fulltext(740 kB)29 downloads
File information
File name FULLTEXT01.pdfFile size 740 kBChecksum SHA-512
aba30843f3d4c3c44396de0f0b758bfde42e2d5b43b5127051514d3c70c3b3b6102438c3a81137fb1476d7d5511004fa3b520d749e74316eaedf33d58058b39e
Type fulltextMimetype application/pdf

Search in DiVA

By author/editor
Schulz, Anton
By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer SciencesComputer Engineering

Search outside of DiVA

GoogleGoogle Scholar
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 122 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf