Automatyczna klasyfikacja obrazów mikroskopowych okrzemek z wykorzystaniem bibliotek Pythona i transfer learningu: badanie porównawcze EfficientNetB0, ResNet50 i VGG16 / Automatic Classification of Microscopic Images of Diatoms Using Python Libraries and Transfer Learning: A Comparative Study of EfficientNetB0, ResNet50, and VGG16
Automatyczna klasyfikacja obrazów mikroskopowych okrzemek z wykorzystaniem bibliotek Pythona i transfer learningu: badanie porównawcze EfficientNetB0, ResNet50 i VGG16 / Automatic Classification of Microscopic Images of Diatoms Using Python Libraries and Transfer Learning: A Comparative Study of EfficientNetB0, ResNet50, and VGG16
Data
2025
Autorzy
Świątczak, Michał
Grudniewski, Tomasz
Tytuł czasopisma
ISSN czasopisma
Tytuł tomu
Wydawca
Akademia Bialska im. Jana Pawła II
Streszczenie
W rozdziale przedstawiono zastosowanie głębokich konwolucyjnych sieci neuronowych
do binarnej klasyfikacji obrazów mikroskopowych na dwie klasy: „okrzemki” oraz „inne
obiekty”. Zbudowano i porównano trzy modele oparte na architekturach EfficientNetB0, ResNet50 oraz VGG16, wykorzystując podejście transfer learning z wagami wstępnie wyuczonymi
na zbiorze ImageNet. Do badań użyto autorskiego zbioru 3236 obrazów mikroskopowych
w jasnym polu, równomiernie podzielonych na klasy diatoms i non_diatoms,
z zastosowaniem normalizacji, dedykowanego preprocessingu oraz augmentacji danych.
Analizowano również wpływ ważenia klas (parametr class_weight) na skuteczność klasyfikacji,
ze szczególnym uwzględnieniem trudniejszej i bardziej zróżnicowanej klasy non_
diatoms. Najlepsze wyniki uzyskano dla modeli ResNet50 i VGG16, które przy braku lub
niewielkim ważeniu klas osiągnęły 100% dokładności i F1-score równy 1,0 na zbiorze
testowym, natomiast EfficientNetB0 – przy odpowiednim doborze class_weight – uzyskał
dokładność rzędu 89%. Omówiono zalety i ograniczenia poszczególnych architektur
w kontekście wymagań obliczeniowych oraz potencjalnych zastosowań w monitoringu
środowiskowym wód. Zaprezentowane wyniki potwierdzają, że nowoczesne modele
CNN mogą istotnie przyspieszyć i zautomatyzować wykrywanie okrzemek, stanowiąc
użyteczne narzędzie wspomagające analizy biologiczne.
This chapter presents the use of deep convolutional neural networks for binary classification of microscopic images into two classes: “diatoms” and “other objects”. Three models based on the EfficientNetB0, ResNet50 and VGG16 architectures were built and compared using a transfer learning approach with weights pre-trained on the ImageNet dataset. The study employed a custom bright-field microscopic dataset of 3,236 images, evenly split into diatom and non-diatom classes, with appropriate normalisation, architecture-specific preprocessing, and data augmentation. The impact of class weighting (class_weight parameter) on classification performance was analysed, with particular attention to the more heterogeneous and complex non_diatoms class. The best results were obtained for ResNet50 and VGG16, which, with no or only mild class weighting, achieved 100% accuracy and an F1-score of 1.0 on the test set. In contrast, EfficientNetB0, with a suitably tuned class weight, achieved an accuracy of approximately 89%. The advantages and limitations of each architecture are discussed in terms of computational cost and potential applications in environmental water monitoring. The results demonstrate that modern CNN models can substantially accelerate and automate diatom detection, providing a valuable tool to support biological and ecological analyses.
This chapter presents the use of deep convolutional neural networks for binary classification of microscopic images into two classes: “diatoms” and “other objects”. Three models based on the EfficientNetB0, ResNet50 and VGG16 architectures were built and compared using a transfer learning approach with weights pre-trained on the ImageNet dataset. The study employed a custom bright-field microscopic dataset of 3,236 images, evenly split into diatom and non-diatom classes, with appropriate normalisation, architecture-specific preprocessing, and data augmentation. The impact of class weighting (class_weight parameter) on classification performance was analysed, with particular attention to the more heterogeneous and complex non_diatoms class. The best results were obtained for ResNet50 and VGG16, which, with no or only mild class weighting, achieved 100% accuracy and an F1-score of 1.0 on the test set. In contrast, EfficientNetB0, with a suitably tuned class weight, achieved an accuracy of approximately 89%. The advantages and limitations of each architecture are discussed in terms of computational cost and potential applications in environmental water monitoring. The results demonstrate that modern CNN models can substantially accelerate and automate diatom detection, providing a valuable tool to support biological and ecological analyses.
Opis
Słowa kluczowe
okrzemki,
klasyfikacja obrazów mikroskopowych,
głębokie sieci konwolucyjne,
diatoms,
microscopic image classification,
deep convolutional neura networks