Information retrieval is a research area that has seen improvements with the development of deep learning and artificial neural networks. The vast amount of image data available today has made it possible to train computer vision models for efficient image search. Content based information retrieval, which is the process of searching for images similar to a query image based on the content, has seen much advancement with the usage of neural network based approaches. Beverage label image retrieval can be considered a special case of the previously mentioned problem; the aim is to find the matching beverage image for the specified query image, contained in the retrieval library. This report evaluates different pretrained computer vision models for the beverage label retrieval task, using a synthetic dataset constructed from a supplied dataset of beverage images. Models of varying size and complexity are evaluated and lastly the effect of adding a segmentation network is studied. Results show promising efficacy of synthetic data for the beverage label retrieval task and both models of larger and smaller sizes perform sufficiently well for practical approaches
Med framgången av djupinlärning har neurala nätverk framgångsrikt tränats och applicerats i informationssökningssytem. Den stora mängd bilddata som idag finns tillgänglig har gjort det möjligt att träna bildigenkänningsmodeller för effektiv bildsökning. Innehållsbaserad informationssökning, vilket är processen av att söka efter bilder baserat på innehållet i självaste bilderna, har sett framgångar med hjälp av lösningar baserade på neurala nätverk. Bildsökning av dryckesetiketter kan anses vara ett specialfall av allmän innehållsbaserad informationssökning. Målet är att hitta den matchande bilden i bildbiblioteket för en specifik bildförfrågan. Denna rapport utvärderar ett flertal förtränade bildigenkänningsmodeller för bildsökning av dryckesetiketter med hjälp av ett syntetiskt dataset. Modeller av varierande storlek och komplexitet utvärderas och till sist studeras effekten av att applicera ett segmenteringsnätverk i processen. Resultaten tyder på en god lämplighet att använda syntetisk data för dryckesetikettsproblemet och att båda större och mindre modeller presterar tillräckligt bra för praktiska implementeringar.