Diabetes is a lifelong chronic disease defined by disorders in protein, fat and carbohydrate metabolism as a result of complete or partial deficiency of insulin hormone secreted from the pancreas. This disease is caused by the absence or deficiency of insulin hormone in the body. Normal metabolism also breaks down in the intestines to convert nutrients into glucose. Then, when this glucose passes through the intestines into the blood, the level of sugar in the blood rises. In healthy people, glucose in the blood is transported to cells with the help of insulin hormone, which is secreted from the pancreas. Because sugar can not be transported to the cell if there is a deficiency or impaired effect of insulin hormone in the body, glucose increases in the blood and develops an increase in blood sugar (hyperglycemia), called diabetes. Early diagnosis of diseases that will occur in insulin, which is vital for the human body, is of great importance. The aim of this study is to use machine learning techniques to diagnose Type 2 diabetes using medical laboratory data. As machine learning techniques, J48, Random Forest, Random Tree and IBk algorithms in the WEKA programme were used. In this study, 400 patient data were investigated. 6 laboratory tests such as age, gender, glucose, HbA1C, HGB and urine were selected as input data. All four algorithms used were successfully trained. The highest accuracy value was found 96.97% in Random Forest algorithm, with recall and F-measure values of 98.47% and 96.24%, respectively.
Type 2 Diabetes WEKA Machine Learning J48 Random Forest Random Tree IBk Algorithms
We would also like to thank Dilara Bilim, Güllü Çıtak and Meryem Ağca for valuable contribution to the study.
Diyabet, pankreastan salgılanan insülin hormonunun tam veya kısmi eksikliği sonucu protein, yağ ve karbonhidrat metabolizmasındaki bozukluklarla tanımlanan, ömür boyu süren kronik bir hastalıktır. Bu hastalığa vücutta insülin hormonunun yokluğu veya eksikliği neden olmaktadır. Normal metabolizma ayrıca besinleri glikoza dönüştürmek için bağırsaklarda parçalanır. Daha sonra bu glikoz bağırsaklardan kana geçtiğinde kandaki şeker seviyesi yükselir. Sağlıklı insanlarda kandaki glikoz, pankreastan salgılanan insülin hormonu yardımıyla hücrelere taşınır. Vücutta insülin hormonunun eksikliği veya etkisinin bozulması durumunda şeker hücreye taşınamadığından, kanda glikoz yükselir ve diyabet adı verilen kan şekerinde yükselme (hiperglisemi) gelişir. İnsan vücudu için hayati önem taşıyan insülinde oluşacak hastalıkların erken teşhisi büyük önem taşımaktadır. Bu çalışmanın amacı, tıbbi laboratuvar verilerini kullanarak Tip 2 diyabeti teşhis etmek için makine öğrenmesi tekniklerini kullanmaktır. Makine öğrenmesi teknikleri olarak WEKA programında yer alan J48, Rastgele Orman, Rastgele Ağaç ve IBk algoritmaları kullanılmıştır. Bu çalışmada 400 hasta verisi incelenmiştir. Girdi verisi olarak yaş, cinsiyet, glikoz, HbA1C, HGB ve idrar gibi 6 laboratuvar testi seçilmiştir. Kullanılan dört algoritmanın tamamı başarıyla eğitildi. En yüksek doğruluk değeri %96.97 oranında Rastgele Orman algoritmasında bulunurken, duyarlılık ve F-ölçüsü değerleri sırasıyla %98.47 ve %96.24 olarak bulunmuştur.
Tip 2 Diyabet WEKA Makine Öğrenmesi J48 Rastgele Orman Rastgele Ağaç IBK Algoritmaları
Birincil Dil | İngilizce |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 30 Kasım 2021 |
Yayımlandığı Sayı | Yıl 2021 |