Automatyczna klasyfikacja obrazów mikroskopowych okrzemek z wykorzystaniem bibliotek Pythona i transfer learningu: badanie porównawcze EfficientNetB0, ResNet50 i VGG16 / Automatic Classification of Microscopic Images of Diatoms Using Python Libraries and Transfer Learning: A Comparative Study of EfficientNetB0, ResNet50, and VGG16

Miniatura obrazu
Data
2025
Autorzy
Świątczak, Michał
Grudniewski, Tomasz
Tytuł czasopisma
ISSN czasopisma
Tytuł tomu
Wydawca
Akademia Bialska im. Jana Pawła II
Streszczenie
W rozdziale przedstawiono zastosowanie głębokich konwolucyjnych sieci neuronowych do binarnej klasyfikacji obrazów mikroskopowych na dwie klasy: „okrzemki” oraz „inne obiekty”. Zbudowano i porównano trzy modele oparte na architekturach EfficientNetB0, ResNet50 oraz VGG16, wykorzystując podejście transfer learning z wagami wstępnie wyuczonymi na zbiorze ImageNet. Do badań użyto autorskiego zbioru 3236 obrazów mikroskopowych w jasnym polu, równomiernie podzielonych na klasy diatoms i non_diatoms, z zastosowaniem normalizacji, dedykowanego preprocessingu oraz augmentacji danych. Analizowano również wpływ ważenia klas (parametr class_weight) na skuteczność klasyfikacji, ze szczególnym uwzględnieniem trudniejszej i bardziej zróżnicowanej klasy non_ diatoms. Najlepsze wyniki uzyskano dla modeli ResNet50 i VGG16, które przy braku lub niewielkim ważeniu klas osiągnęły 100% dokładności i F1-score równy 1,0 na zbiorze testowym, natomiast EfficientNetB0 – przy odpowiednim doborze class_weight – uzyskał dokładność rzędu 89%. Omówiono zalety i ograniczenia poszczególnych architektur w kontekście wymagań obliczeniowych oraz potencjalnych zastosowań w monitoringu środowiskowym wód. Zaprezentowane wyniki potwierdzają, że nowoczesne modele CNN mogą istotnie przyspieszyć i zautomatyzować wykrywanie okrzemek, stanowiąc użyteczne narzędzie wspomagające analizy biologiczne.
This chapter presents the use of deep convolutional neural networks for binary classification of microscopic images into two classes: “diatoms” and “other objects”. Three models based on the EfficientNetB0, ResNet50 and VGG16 architectures were built and compared using a transfer learning approach with weights pre-trained on the ImageNet dataset. The study employed a custom bright-field microscopic dataset of 3,236 images, evenly split into diatom and non-diatom classes, with appropriate normalisation, architecture-specific preprocessing, and data augmentation. The impact of class weighting (class_weight parameter) on classification performance was analysed, with particular attention to the more heterogeneous and complex non_diatoms class. The best results were obtained for ResNet50 and VGG16, which, with no or only mild class weighting, achieved 100% accuracy and an F1-score of 1.0 on the test set. In contrast, EfficientNetB0, with a suitably tuned class weight, achieved an accuracy of approximately 89%. The advantages and limitations of each architecture are discussed in terms of computational cost and potential applications in environmental water monitoring. The results demonstrate that modern CNN models can substantially accelerate and automate diatom detection, providing a valuable tool to support biological and ecological analyses.
Opis
Słowa kluczowe
okrzemki, klasyfikacja obrazów mikroskopowych, głębokie sieci konwolucyjne, diatoms, microscopic image classification, deep convolutional neura networks
Cytowanie