Research Article
BibTex RIS Cite

Classification of Type 2 Diabetes Using Machine Learning Techniques

Year 2021, , 1265 - 1268, 30.11.2021
https://doi.org/10.31590/ejosat.1014878

Abstract

Diabetes is a lifelong chronic disease defined by disorders in protein, fat and carbohydrate metabolism as a result of complete or partial deficiency of insulin hormone secreted from the pancreas. This disease is caused by the absence or deficiency of insulin hormone in the body. Normal metabolism also breaks down in the intestines to convert nutrients into glucose. Then, when this glucose passes through the intestines into the blood, the level of sugar in the blood rises. In healthy people, glucose in the blood is transported to cells with the help of insulin hormone, which is secreted from the pancreas. Because sugar can not be transported to the cell if there is a deficiency or impaired effect of insulin hormone in the body, glucose increases in the blood and develops an increase in blood sugar (hyperglycemia), called diabetes. Early diagnosis of diseases that will occur in insulin, which is vital for the human body, is of great importance. The aim of this study is to use machine learning techniques to diagnose Type 2 diabetes using medical laboratory data. As machine learning techniques, J48, Random Forest, Random Tree and IBk algorithms in the WEKA programme were used. In this study, 400 patient data were investigated. 6 laboratory tests such as age, gender, glucose, HbA1C, HGB and urine were selected as input data. All four algorithms used were successfully trained. The highest accuracy value was found 96.97% in Random Forest algorithm, with recall and F-measure values of 98.47% and 96.24%, respectively.

Thanks

We would also like to thank Dilara Bilim, Güllü Çıtak and Meryem Ağca for valuable contribution to the study.

References

  • Ahmed, T. M. (2016). Using data mining to develop model for classifying diabetic patient control level based on historical medical records. Journal of Theoretical and Applied Information Technology, 87(2), 316-323.
  • Ahmed, T. M. (2016). Developing a predicted model for diabetes type 2 treatment plans by using data mining. Journal of Theoretical and Applied Information Technology, 90(2), 181-187.
  • Bozkurt, M. R., Yurtay, N., Yılmaz, Z., & Sertkaya, C. (2014). Comparison of different methods for determining diabetes. Turkish Journal of Electrical Engineering & Computer Sciences, 22, 1044-1055.
  • Coşansu, G. (2015). Diyabet: küresel bir salgın hastalık. Okmeydanı Tıp Dergisi, 31(Ek Sayı), 1-6.
  • Güler, İ., & Übeyli, E. (2006). Çok katmanlı perseptron sinir ağları ile diyabet hastalığının teşhisi. Journal of the Faculty of Engineering and Architecture of Gazi University, 21(2), 319-326.
  • Kalmegh, S. (2015). Analysis of weka data mining algorithm reptree, simple cart and randomtree for classification of indian news. International Journal of Innovative Science, Engineering & Technology, 2(2), 438-446.
  • Kaya, C., Erkaymaz, O., Ayar, O., & Özer, M. (2017). Classification of diabetic retinopathy disease from Video-Oculography (VOG) signals with feature selection based on C4.5 decision tree. Proceedings of 2017 Medical Technologies National Congress (TIPTEKNO), 1-4. https://ieeexplore.ieee.org/document/8238093.
  • Kaya, C., Erkaymaz, O., Ayar, O., & Özer, M. (2018). Impact of hybrid neural network on the early diagnosis of diabetic retinopathy disease from video-oculography signals. Chaos, Solitons & Fractals, 114, 164-174.
  • Özlüer Başer, B., Yangın, M., & Sarıdaş, E. (2021). Makine öğrenmesi teknikleriyle diyabet hastalığının sınıflandırılması. Süleyman Demirel University Journal of Natural and Applied Sciences, 25(1), 112-120.
  • Sarica, A., Ceresa, A., & Quattrone, A. (2017). Random forest algorithm for the classification of neuroimaging data in alzheimer's disease: a systematic review. Frontiers in Aging Neuroscience, 9(329), 1-12.
  • Taşcı, M. E., & Şamlı, R. (2020). Veri madenciliği ile kalp hastalığı teşhisi. European Journal of Science and Technology, (Special Issue), 88-95.
  • Timuçin, T., & Düzdar Argun, İ. (2021). Initial seed value effectiveness on performances of data mining algorithms. Düzce University Journal of Science and Technology, 9, 555-567.
  • Uzun, R., İşler, Y., & Toksan, M. (2019). WEKA yazılım paketinin siğil tedavi yöntemlerinin başarısının tahmininde kullanımı. Düzce University Journal of Science and Technology, 7, 699-708.

Tip 2 Diyabetin Makine Öğrenmesi Teknikleriyle Sınıflandırılması

Year 2021, , 1265 - 1268, 30.11.2021
https://doi.org/10.31590/ejosat.1014878

Abstract

Diyabet, pankreastan salgılanan insülin hormonunun tam veya kısmi eksikliği sonucu protein, yağ ve karbonhidrat metabolizmasındaki bozukluklarla tanımlanan, ömür boyu süren kronik bir hastalıktır. Bu hastalığa vücutta insülin hormonunun yokluğu veya eksikliği neden olmaktadır. Normal metabolizma ayrıca besinleri glikoza dönüştürmek için bağırsaklarda parçalanır. Daha sonra bu glikoz bağırsaklardan kana geçtiğinde kandaki şeker seviyesi yükselir. Sağlıklı insanlarda kandaki glikoz, pankreastan salgılanan insülin hormonu yardımıyla hücrelere taşınır. Vücutta insülin hormonunun eksikliği veya etkisinin bozulması durumunda şeker hücreye taşınamadığından, kanda glikoz yükselir ve diyabet adı verilen kan şekerinde yükselme (hiperglisemi) gelişir. İnsan vücudu için hayati önem taşıyan insülinde oluşacak hastalıkların erken teşhisi büyük önem taşımaktadır. Bu çalışmanın amacı, tıbbi laboratuvar verilerini kullanarak Tip 2 diyabeti teşhis etmek için makine öğrenmesi tekniklerini kullanmaktır. Makine öğrenmesi teknikleri olarak WEKA programında yer alan J48, Rastgele Orman, Rastgele Ağaç ve IBk algoritmaları kullanılmıştır. Bu çalışmada 400 hasta verisi incelenmiştir. Girdi verisi olarak yaş, cinsiyet, glikoz, HbA1C, HGB ve idrar gibi 6 laboratuvar testi seçilmiştir. Kullanılan dört algoritmanın tamamı başarıyla eğitildi. En yüksek doğruluk değeri %96.97 oranında Rastgele Orman algoritmasında bulunurken, duyarlılık ve F-ölçüsü değerleri sırasıyla %98.47 ve %96.24 olarak bulunmuştur.

References

  • Ahmed, T. M. (2016). Using data mining to develop model for classifying diabetic patient control level based on historical medical records. Journal of Theoretical and Applied Information Technology, 87(2), 316-323.
  • Ahmed, T. M. (2016). Developing a predicted model for diabetes type 2 treatment plans by using data mining. Journal of Theoretical and Applied Information Technology, 90(2), 181-187.
  • Bozkurt, M. R., Yurtay, N., Yılmaz, Z., & Sertkaya, C. (2014). Comparison of different methods for determining diabetes. Turkish Journal of Electrical Engineering & Computer Sciences, 22, 1044-1055.
  • Coşansu, G. (2015). Diyabet: küresel bir salgın hastalık. Okmeydanı Tıp Dergisi, 31(Ek Sayı), 1-6.
  • Güler, İ., & Übeyli, E. (2006). Çok katmanlı perseptron sinir ağları ile diyabet hastalığının teşhisi. Journal of the Faculty of Engineering and Architecture of Gazi University, 21(2), 319-326.
  • Kalmegh, S. (2015). Analysis of weka data mining algorithm reptree, simple cart and randomtree for classification of indian news. International Journal of Innovative Science, Engineering & Technology, 2(2), 438-446.
  • Kaya, C., Erkaymaz, O., Ayar, O., & Özer, M. (2017). Classification of diabetic retinopathy disease from Video-Oculography (VOG) signals with feature selection based on C4.5 decision tree. Proceedings of 2017 Medical Technologies National Congress (TIPTEKNO), 1-4. https://ieeexplore.ieee.org/document/8238093.
  • Kaya, C., Erkaymaz, O., Ayar, O., & Özer, M. (2018). Impact of hybrid neural network on the early diagnosis of diabetic retinopathy disease from video-oculography signals. Chaos, Solitons & Fractals, 114, 164-174.
  • Özlüer Başer, B., Yangın, M., & Sarıdaş, E. (2021). Makine öğrenmesi teknikleriyle diyabet hastalığının sınıflandırılması. Süleyman Demirel University Journal of Natural and Applied Sciences, 25(1), 112-120.
  • Sarica, A., Ceresa, A., & Quattrone, A. (2017). Random forest algorithm for the classification of neuroimaging data in alzheimer's disease: a systematic review. Frontiers in Aging Neuroscience, 9(329), 1-12.
  • Taşcı, M. E., & Şamlı, R. (2020). Veri madenciliği ile kalp hastalığı teşhisi. European Journal of Science and Technology, (Special Issue), 88-95.
  • Timuçin, T., & Düzdar Argun, İ. (2021). Initial seed value effectiveness on performances of data mining algorithms. Düzce University Journal of Science and Technology, 9, 555-567.
  • Uzun, R., İşler, Y., & Toksan, M. (2019). WEKA yazılım paketinin siğil tedavi yöntemlerinin başarısının tahmininde kullanımı. Düzce University Journal of Science and Technology, 7, 699-708.
There are 13 citations in total.

Details

Primary Language English
Subjects Engineering
Journal Section Articles
Authors

Ziynet Pamuk 0000-0003-3792-2183

Ceren Kaya 0000-0002-1970-2833

Publication Date November 30, 2021
Published in Issue Year 2021

Cite

APA Pamuk, Z., & Kaya, C. (2021). Classification of Type 2 Diabetes Using Machine Learning Techniques. Avrupa Bilim Ve Teknoloji Dergisi(28), 1265-1268. https://doi.org/10.31590/ejosat.1014878