Diyabet, dünya çapında artan ve gerçekleşen ölümlerin önde gelen nedenlerinden biridir. Sürekli artan vaka sayısı diyabetin önlenmesi, erken teşhisi, tedavisi ve takibi konularında bilimsel çalışmalara ihtiyaç duyulduğunu göstermektedir. Son dönemlerde medikal alanda yaşanan teknolojik gelişmeler sayesinde elde edilen verinin analiz edilmesi, hastalıkların tanı ve tedavi sürecine olumlu katkılar yapmaktadır. Diyabet hastalığı kapsamında da araştırmacılar, hastalığın teşhis edilmesine yönelik, veriye dayalı sistematik yaklaşımlar geliştirmeye çalışmaktadırlar. Bu amaç doğrultusunda çalışmada, 1999-2008 yılları arasında ABD’de bulunan 130 hastanedeki 70000 kayda ait sağlık vakalarından elde edilmiş veri seti düzenlenerek, bireylerin diyabet durumuna göre sınıflandırılması hedeflenmiştir. Sınıflandırma için veri setine uygun makine öğrenmesi algoritmalarından yararlanılmış ve bu algoritmaların sonuçları performans ölçütlerine göre karşılaştırılmıştır. Elde edilen sonuçlara göre, en iyi performans gösteren beş sınıflandırma algoritması (Karar ağaçları, k-en yakın komşuluk, Lojistik regresyon, Naive Bayes ve Rastgele orman) değerlendirmeye alınmış olup en iyi doğru sınıflandırma performansı Rastgele orman algoritması ile elde edilmiştir.
Mimar Sinan Güzel Sanatlar Üniversitesi
2019-30
Bu çalışma, Mimar Sinan Güzel Sanatlar Üniversitesi, Bilimsel Araştırma Projeleri birimi tarafından 2019-30 numaralı proje ile maddi olarak desteklenmiştir.
Diabetes is one of the leading causes of rising and occurring deaths worldwide. The ever-increasing number of cases indicates the need for scientific studies on the prevention, early diagnosis, treatment, and follow-up of diabetes. Analyzing the data obtained with the recent technological developments in the medical field makes positive contributions to the diagnosis and treatment process of diseases. As related to diabetes, researchers are trying to develop data-based systematic approaches to diagnose the disease. Following this purpose, the study aims to classify individuals according to their diabetes status by arranging a data set obtained from 70000 records of health cases in 130 hospitals in the USA between 1999-2008. Machine learning algorithms suitable for the data set are used for the classification and the results of these algorithms are compared regarding the performance criteria. According to the results, the best performing five classification algorithms (Decision trees, k-nearest neighborhood, Logistic regression, Naive Bayes, and Random forest) are evaluated and the best classification performance is obtained with the Random forest algorithm.
Diabetes Mellitus Machine Learning Classification Algorithms
2019-30
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Proje Numarası | 2019-30 |
Yayımlanma Tarihi | 20 Nisan 2021 |
Yayımlandığı Sayı | Yıl 2021 Cilt: 25 Sayı: 1 |
e-ISSN: 1308-6529