Prediction of type 2 diabetes mellitus using feature selection-based machine learning algorithms Przewidywanie cukrzycy typu 2 z wykorzystaniem algorytmów uczenia maszynowego opartych na selekcji cech

Miniatura obrazu
Data
2022-06-30
Autorzy
Yilmaz, Atinç
Tytuł czasopisma
ISSN czasopisma
Tytuł tomu
Wydawca
Akademia Bialska Nauk Stosowanych im. Jana Pawła II
Streszczenie
Background. The aim of this study is to develop and evaluate a machine learning model for the early diagnosis of type 2 diabetes to allow for treatments to be applied in the early stages of the disease. Material and methods. A proposed hybrid machine learning model was developed and applied to the Early-stage diabetes risk prediction dataset from the UCI database. The prediction success of the proposed model was compared with other machine learning models. Pearson’s correlation and SelectKBest feature selection methods were employed to examine the relationships between the dataset input parameters and the results. Results. Of the 520 patients included in the dataset, 320 were diagnosed with diabetes and 328 (63.08%) were males. The most commonly observed diabetes diagnosis criterion was obesity (n=482, 83.08%). While the strongest feature detected with Pearson’s correlation was polyuria, the strongest feature detected with SelectKBest was polydipsia. With Pearson’s feature extraction, the most successful machine learning method was the proposed hybrid method, with an accuracy of 97.28%. Using SelectKBest feature selection, the same model was able to predict type 2 diabetes with accuracy of 95.16%. Conclusions. Early detection of type 2 diabetes will allow for a prompter and more effective treatment of the patient. Thus, use of the proposed model may help to improve the quality of patient care and lower the number of deaths caused by this disease.
Wprowadzenie. Celem niniejszego badania jest opracowanie i ewaluacja modelu uczenia maszynowego umożliwiającego wczesną diagnozę cukrzycy typu 2, która pozwala na podjęcie leczenia na początkowym etapie choroby. Materiał i metody. Zaproponowany hybrydowy model uczenia maszynowego został przygotowany i zastosowany z wykorzystaniem zbioru danych Early-stage diabetes risk prediction dataset pochodzącego z bazy UCI. Proponowany model porównano z innymi modelami uczenia maszynowego pod względem skuteczności przewidywania. Aby zbadać związek pomiędzy parametrami wejściowymi zbioru danych a wynikami, zastosowano metodę korelacji Pearsona oraz metodę selekcji cech SelectKBest. Wyniki. Spośród 520 przypadków uwzględnionych w zbiorze danych, 320 miało rozpoznaną cukrzycę, a 328 z nich (63,08%) to mężczyźni. Najczęstszym kryterium rozpoznania cukrzycy była otyłość (n=482, 83,08%). Podczas gdy najsilniejszą cechą wykrytą metodą Pearsona była poliuria, najsilniejszą cechą wykrytą metodą SelectKBest okazała się polidypsja. W przypadku ekstrakcji cech Pearsona najskuteczniejszą metodą uczenia maszynowego była zaproponowana metoda hybrydowa, której dokładność wynosi 97,28%. Ten sam model był w stanie przewidzieć zachorowanie na cukrzycę typu 2 z dokładnością 95,16% za pomocą selekcji cech SelectKBest. Wnioski. Wczesne wykrycie cukrzycy typu 2 pozwoli na szybsze i skuteczniejsze leczenie pacjenta. Dlatego też zaproponowany model może pomóc w podniesieniu jakości opieki nad pacjentami, a także w obniżeniu liczby zgonów spowodowanych tą chorobą.
Opis
Słowa kluczowe
feature selection, health information system, type 2 diabetes, machine learning, nursing care, selekcja cech, system informacji zdrowotnej, cukrzyca typu 2, uczenie maszynowe, opieka pielęgniarska
Cytowanie
Yılmaz A. Prediction of type 2 diabetes mellitus using feature selection-based machine learning algorithms. Health Prob Civil. 2022; 16(2): 128-139. https://doi.org/10.5114/hpc.2022.114541