Research Article
BibTex RIS Cite

Destek Vektör Makineleri ve Naive Bayes Sınıflandırma Algoritmalarını Kullanarak Diabetes Mellitus Tahmini

Year 2021, Issue: 32, 7 - 13, 31.12.2021
https://doi.org/10.31590/ejosat.1041186

Abstract

Makine öğrenmesi, herhangi bir insan müdahalesi olmadan elde olan verilerden veya analizlerinden daha iyi sonuçlar elde edilmesine yardımcı olan alanlardan biridir. Ciddi ve karmaşık durumları analiz etmek ve doğruluk oranı yüksek tahminlerde bulunmak için son yıllarda gelişen teknolojiyle birlikte özellikte tıbbi teşhis alanında yaygın olarak kullanılmaktadır. Bu çalışma kapsamında Pima Indians Diyabet veri seti (Pima Indian Diabetes Dataset) üzerinde Naive Bayes ve Destek Vektör Makineleri (DVM) makine öğrenme algoritmaları kullanılarak diyabet hastalığı erken evrede teşhis edilmeye çalışılmıştır. Kullanılan sınıflandırıcıların performanslarını artırmak için veri setinde eksik değerler çarpıklık durumuna göre tekrar yapılandırılmış, veri standardizasyonu standart ölçeklendirme kullanılarak yapılmıştır. Ayrıca sınıf dengesizlik probleminin sınıflandırma üzerindeki olumsuz etkisini azaltmak için Sentetik Azınlık Aşırı-Örnekleme (SMOTE) tekniği kullanılmıştır. Çalışma kapsamında oluşturulan sınıflandırıcıların değerlendirme kriterleri Doğruluk Oranı (Accuracy Rate), Kesinlik (Precision), Duyarlılık (Recall) ve F1-Skore (F1 Score) metrikleri kullanılarak hesaplanmıştır. Destek Vektör Makineleri %90 doğruluk oranı ile en iyi sunucu vermiştir.

References

  • https://www.who.int/health-topics/diabetes#tab=tab_1,21 Mayıs 2021 tarihinde alındı. (Erişim Tarihi: 31.05.2021).
  • Özlüer Başer, B. , Yangın, M. & Sarıdaş, E. S. (2021). Makine Öğrenmesi Teknikleriyle Diyabet Hastalığının Sınıflandırılması. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 25(1), 112-120. DOI: 10.19113/sdufenbed.842460.
  • Srinivasa R, Yashashwini, Shubham janakatti, Venkatesh K B, Yaswanth S P. (2020). Prediction of Diabetes using Machine Learning. International Journal of Advanced Science and Technology, 29(06), 7593 - 7601.
  • Kayaer, K., & Yıldırım, T. (2003). MEDICAL DIAGNOSIS ON PIMA INDIAN DIABETES USING GENERAL REGRESSION NEURAL NETWORKS. Proceedings of the International Conference on Artificial Neural Networks and Neural Information Processing, 2003.
  • Bilgin, G. (2021). Makine Öğrenmesi Algoritmaları Kullanarak Erken Dönemde Diyabet Hastalığı Riskinin Araştırılması . Journal of Intelligent Systems: Theory and Applications , 4 (1) , 55-64 . DOI: 10.38016/jista.877292.
  • Maniruzzaman, M., Rahman, M.J., Ahammed, B. (2020). Classification and prediction of diabetes disease using machine learning paradigm. Health Inf Sci Syst. 8, 7. https://doi.org/10.1007/s13755-019-0095-z.
  • Turhan, S., Yüksel, Ö., Şarer Yürekli, B. P., Suner, A., Doğu E. (2020) . Sınıf Dengesizliği Varlığında Hastalık Tanısı için Kolektif Öğrenme Yöntemlerinin Karşılaştırılması: Diyabet Tanısı Örneği. Türkiye Klinikleri Biyoistatistik Dergisi. 12 (1), 16-26. DOI: 10.5336/biostatic.2019-66816.
  • Nitesh V. Chawla, Kevin W. Bowyer, Lawrence O. Hall, and W. Philip Kegelmeyer. (2002. SMOTE). synthetic minority over-sampling technique. J. Artif. Int. Res. 16, 1 , 321–357
  • Cover, T. M. (1965). Geometrical and statistical properties of systems of linear inequalities with applications in pattern recognition. IEEE Trans. Electron. Comput. 14 (3), 326–334.
  • Cortes, C. and Vapnik, V. (1995) Support-Vector Networks. Machine Learning, 20, 273-297. http://dx.doi.org/10.1007/BF00994018.
  • Qi, Z., Tian, Y., & Shi, Y. (2013). Robust twin support vector machine for pattern classification. Pattern Recognit., 46, 305-316

Prediction of Diabetes Mentillus by Using SVM and Naive Bayes Classification Algorithms

Year 2021, Issue: 32, 7 - 13, 31.12.2021
https://doi.org/10.31590/ejosat.1041186

Abstract

Machine learning is one of the fields that help to get better results from data or analysis without any human intervention. In recent years with the developing technology, it is widely used in the field of medical diagnosis, especially to analyze serious and complex situations and make predictions with high accuracy. In this study, it was tried to diagnose diabetic disease at an early stage by using Naïve Bayes and Support Vector Machines (DVM) machine learning algorithms on Pima Indians Diabetes Dataset. In order to increase the performance of the classifiers used, the missing values in the data set were restructured according to the skewness, and data standardization was done using standard scaling. Then, the Synthetic Minority Oversampling (SMOTE) technique was used to reduce the negative effect of class imbalance problem on classification. Evaluation criteria of the classifiers created within the scope of the study were calculated by using Accuracy Rate, Precision, Recall and F1-Score (F1 Score) values. According to these results, Support Vector Machines gave the best server with 88% accuracy rate.

References

  • https://www.who.int/health-topics/diabetes#tab=tab_1,21 Mayıs 2021 tarihinde alındı. (Erişim Tarihi: 31.05.2021).
  • Özlüer Başer, B. , Yangın, M. & Sarıdaş, E. S. (2021). Makine Öğrenmesi Teknikleriyle Diyabet Hastalığının Sınıflandırılması. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 25(1), 112-120. DOI: 10.19113/sdufenbed.842460.
  • Srinivasa R, Yashashwini, Shubham janakatti, Venkatesh K B, Yaswanth S P. (2020). Prediction of Diabetes using Machine Learning. International Journal of Advanced Science and Technology, 29(06), 7593 - 7601.
  • Kayaer, K., & Yıldırım, T. (2003). MEDICAL DIAGNOSIS ON PIMA INDIAN DIABETES USING GENERAL REGRESSION NEURAL NETWORKS. Proceedings of the International Conference on Artificial Neural Networks and Neural Information Processing, 2003.
  • Bilgin, G. (2021). Makine Öğrenmesi Algoritmaları Kullanarak Erken Dönemde Diyabet Hastalığı Riskinin Araştırılması . Journal of Intelligent Systems: Theory and Applications , 4 (1) , 55-64 . DOI: 10.38016/jista.877292.
  • Maniruzzaman, M., Rahman, M.J., Ahammed, B. (2020). Classification and prediction of diabetes disease using machine learning paradigm. Health Inf Sci Syst. 8, 7. https://doi.org/10.1007/s13755-019-0095-z.
  • Turhan, S., Yüksel, Ö., Şarer Yürekli, B. P., Suner, A., Doğu E. (2020) . Sınıf Dengesizliği Varlığında Hastalık Tanısı için Kolektif Öğrenme Yöntemlerinin Karşılaştırılması: Diyabet Tanısı Örneği. Türkiye Klinikleri Biyoistatistik Dergisi. 12 (1), 16-26. DOI: 10.5336/biostatic.2019-66816.
  • Nitesh V. Chawla, Kevin W. Bowyer, Lawrence O. Hall, and W. Philip Kegelmeyer. (2002. SMOTE). synthetic minority over-sampling technique. J. Artif. Int. Res. 16, 1 , 321–357
  • Cover, T. M. (1965). Geometrical and statistical properties of systems of linear inequalities with applications in pattern recognition. IEEE Trans. Electron. Comput. 14 (3), 326–334.
  • Cortes, C. and Vapnik, V. (1995) Support-Vector Networks. Machine Learning, 20, 273-297. http://dx.doi.org/10.1007/BF00994018.
  • Qi, Z., Tian, Y., & Shi, Y. (2013). Robust twin support vector machine for pattern classification. Pattern Recognit., 46, 305-316
There are 11 citations in total.

Details

Primary Language Turkish
Subjects Engineering
Journal Section Articles
Authors

Güneş Harman 0000-0001-5413-124X

Publication Date December 31, 2021
Published in Issue Year 2021 Issue: 32

Cite

APA Harman, G. (2021). Destek Vektör Makineleri ve Naive Bayes Sınıflandırma Algoritmalarını Kullanarak Diabetes Mellitus Tahmini. Avrupa Bilim Ve Teknoloji Dergisi(32), 7-13. https://doi.org/10.31590/ejosat.1041186