Diabetes is a chronic metabolic disease in which the level of glucose in the blood rises above normal. The main reason for this is that the pancreas cannot produce enough insulin or the insulin produced cannot be used effectively. For diabetes to be managed and complications to be avoided, early diagnosis is essential. Advanced technologies such as machine learning contribute to both individual health management and public health systems by providing high accuracy rates in early diagnosis. In this study, it is aimed to examine the role of machine learning methods in the early diagnosis of diabetes. For this purpose, the methods were analysed on two different datasets. Support Vector Machines, Decision Trees, and Artificial Neural Networks were among the machine learning classifiers that were employed. In both datasets, the performance of the models in terms of metrics such as accuracy, sensitivity, and specificity were evaluated and compared. According to the results, the Bagged Trees algorithm showed the best performance with 96.2% in the first dataset we used, BIT Mesra Dataset. In the Pima Indian dataset, the SVM algorithm achieved an accuracy rate of 77.2%. The study provides a method for early diagnosis of diabetes, and emphasises the importance of data diversity in this field.
Diyabet, kandaki glikoz düzeyinin normalin üzerine çıktığı kronik bir metabolik hastalıktır. Bunun temel nedeni pankreasın yeterli insülin üretememesi veya üretilen insülinin etkili bir şekilde kullanılamamasıdır. Diyabetin yönetilebilmesi ve komplikasyonların önlenebilmesi için erken tanı olmazsa olmazdır. Makine öğrenimi gibi ileri teknolojiler erken tanıda yüksek doğruluk oranları sağlayarak hem bireysel sağlık yönetimine hem de toplum sağlığı sistemlerine katkı sağlamaktadır. Bu çalışmada, diyabetin erken tanısında makine öğrenimi yöntemlerinin rolünün incelenmesi amaçlanmıştır. Bu amaçla yöntemler iki farklı veri seti üzerinde analiz edilmiştir. Destek Vektör Makineleri, Karar Ağaçları ve Yapay Sinir Ağları kullanılan makine öğrenimi sınıflandırıcıları arasındaydı. Her iki veri setinde de modellerin doğruluk, duyarlılık ve özgüllük gibi metrikler açısından performansları değerlendirilmiş ve karşılaştırılmıştır. Sonuçlara göre Bagged Trees algoritması kullandığımız ilk veri seti olan BIT Mesra Veri kümesinde %96,2 ile en iyi performansı göstermiştir. Pima Indian veri kümesinde, SVM algoritması %77,2'lik bir doğruluk oranına ulaştı. Çalışma, diyabetin erken teşhisi için bir yöntem sunmakta ve bu alanda veri çeşitliliğinin önemini vurgulamaktadır.
| Primary Language | English |
|---|---|
| Subjects | Machine Learning (Other) |
| Journal Section | PAPERS |
| Authors | |
| Publication Date | June 1, 2025 |
| Submission Date | February 3, 2025 |
| Acceptance Date | February 20, 2025 |
| Published in Issue | Year 2025 Volume: 10 Issue: 1 |
The Creative Commons Attribution 4.0 International License
is applied to all research papers published by JCS and
A Digital Object Identifier (DOI)
is assigned for each published paper.