Research Article
BibTex RIS Cite

Normalizasyon Yöntemlerinin Biyomedikal Verilerde Sınıflandırma Performansına Etkisi

Year 2021, Issue: 30, 35 - 43, 15.12.2021
https://doi.org/10.31590/ejosat.1011723

Abstract

Günümüzde tıpta hastalıklarla ilgili veri miktarı artmakta ve bu verilerden hastalığın sınıfı hakkında tahminler yapılmaktadır. Bu tahminlere için olumlu sonuç sağlayabilecek teknikler üzerinde çalışmalar geliştirilmektedir. Bu tahminler için kullanılacak olan sınıflandırma algoritmaları bu tekniklerle daha doğru sınıflandırma başarısı gösterebilmektedir. Bu çalışmada karaciğer ve kalp hastalığı veri setleri ondalık ölçekleme, minimum maksimum, z-skor ve norm normalizasyon yöntemleriyle normalize edilmiştir. Daha sonra bu normalize edilen veriler ve ham verilere, 4 farklı k-kat çapraz değerlendirmede (2,5,10,20) yapay sinir ağları, Naive Bayes, destek vektör makinesi, k-NN ve karar ağacı gibi çeşitli sınıflandırma algoritmalarıyla ORANGE programı kullanılarak sınıflandırma işlemine tabi tutulmuştur. Verilerin sınıflama doğrulukları değerlendirilmiş ve normalizasyon yöntemlerinin sınıflandırma performansını artırdığı gözlemlenmiştir.

References

  • Adeyemo A. and Wimmer H. (2018). Effects of Normalization Techniques on Logistic Regression in Data Science. 2018 Proceedings of the Conference on Information Systems Applied Research Norfolk, Virginia
  • Akdemir B. (2009). Tahmin uygulamalarında performans geliştirmek için kullanılan normalizasyon metotlarına yeni bir yaklaşım, Selçuk Üniversitesi Fen Bilimleri Enstitüsü, Doktora Tezi
  • Atomi V. H (2012). The effect of data preprocessing on the performance of artificial neural networks techniques for classification problem, Master Thesis, Faculty of Computer Science and Information Technology, University Tun Hussein Onn Malaysia
  • Bolandraftar M., Imandoust S. B. (2013). Application of K-Nearest Neighbor (KNN) Approach for Predicting Economic Events: Theoretical Background, S B Imandoust et al. Int. Journal of Engineering Research and Applications, Vol:3, Issue 5, 605-610.
  • Çalış A., Kayapınar S., Çetinyokuş T. (2014). Veri madenciliğinde karar ağacı algoritmaları ile bilgisayar ve internet güvenliği üzerine bir uygulama. Endüstri Mühendisliği Dergisi, Cilt:25, Sayı: 3-4,2-19.
  • Çalışkan S. B., Soğukpınar İ. (2008). k-means ve k en yakın komşu yöntemleri ile ağlarda nüfuz tespiti
  • Eesa A.S., Arabo W. K. (2017). Normalization methods for backpropagation: A comparative study, Science Journal of University of Zakho, Vol:5, No:4, 314-318.
  • Gautam R., Vanga S., Ariese F., Umapathy S. (2015). Review of multidimensional data processing approaches for Raman and infrared spectroscopy. EPJ Techniques and Instrumentation, 2:8,2015. DOI: 10.1140/epjti/s40485-015-0018-6
  • https://e-abm.com/how-to-establish-quality-and-correctness-of-classification-models-part-3-confusion-matrix/
  • https://en.wikipedia.org/wiki/Orange_(software)
  • http://kod5.org/yapay-sinir-aglari-ysa-nedir/
  • https://kodedu.com/2014/05/naive-bayes siniflandirma-algoritmasi/
  • https://medium.com/@ekrem.hatipoglu/machine- learning-prediction-algorithms-decision-tree-random-forest-part-5-2970905c021e.
  • https://medium.com/@k.ulgen90/makine%C3%B6%C4%9FFrenimib%C3%B6I%C3%BCm-5-karar-a%C4%F9a%C3%A7lar%C4%B1-c90bd7593010
  • https://orangedatamining.com/widget-catalog/
  • https://orangedatamining.com/download/#windows
  • http://www.iitmandi.ac.in/ciare/files/7_Anand_ANN.pdf
  • Jadhav S. D., Channe H. P. (2013). Comparative study of k-nn, naive bayes and decision tree classification techniques, International Journal of Science and Research (IJSR)
  • Kavzoğlu T. ve Çölkesen İ. (2010). Destek vektör makineleri ile uydu görüntülerinin sınıflandırılmasında kernel fonksiyonlarının etkilerinin incelenmesi, Harita Dergisi, Sayı 144
  • Mohamed A. E. (2017). Comparative study of four supervised machine learning techniques for classification. International Journal of Applied Science and Technology, Vol:7, No:2
  • Muthuselvan S., Rajapraksh S., Somasundaram K, KKarthik K. (2018). Classification of Liver Patient Dataset Using Machine Learning Algorithms, International Journal of Engineering & Technology, 7 (3.34), 323-326.
  • Polat K. (2008). Biyomedikal sinyallerde veri ön-işleme tekniklerinin medikal teşhiste sınıflama doğruluğuna etkisinin incelenmesi. Selçuk Üniversitesi Fen Bilimleri Enstitüsü, Doktora tezi
  • Shalabi, L.A., Z. Shaaban and Kasasbeh, B. (2006). Data Mining: A Preprocessing Engine, J. Comput. Sci., 2: 735-739
  • Singh B K, Thoke A. S. and Verma K. (2015). Investigations on Impact of Feature Normalization Techniques on Classifier’s Performance in Breast Tumor Classification, International Journal of Computer Applications (ISSN: 0975 – 8887) Volume 116 – No. 19, 11-15.
  • www.codecademy.com/articles/normalization
  • Yavuz S., Deveci M. (2012). İstatiksel normalizasyon tekniklerinin yapay sinir ağın performansına etkisi, Erciyes Üniversitesi İktisadi ve İdari Bilimler Dergisi, Sayı 40, 167-187.
  • Yazıcı A. C., Öğüş E., Ankaralı S., Canan S., Ankaralı H., Akkuş Z. (2007). Yapay sinir ağlarına genel bakış, Turkiye Klinikleri J Med Sci, 27:65-71.
  • Yüce H. (2021). Normalizasyon tekniklerinin biyomedikal verilerde sınıflama başarısına etkisi, Necmettin Erbakan Üniversitesi Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi.

Effect of Normalization Techniques on Classification Success in Biomedical Data

Year 2021, Issue: 30, 35 - 43, 15.12.2021
https://doi.org/10.31590/ejosat.1011723

Abstract

Nowadays, the amount of data about diseases in medicine is increasing and predictions about the class of the disease are made from these data. Studies are being developed on techniques that can provide positive results for these predictions. Classification algorithms that will make these predictions can show more accurate classification success with these techniques. In this study, liver and heart disease data sets were normalized using decimal scaling, minimum maximum, z-score and norm normalization methods. Then, these normalized datas and raw datas are classified using the ORANGE program with various classification algorithms such as artificial neural networks, decision tree, support vector machine, k-NN and Naive Bayes in 4 different k-fold cross validation (2,5,10,20) has been processed. The classification accuracies of the data were evaluated and were observed that normalization methods increased the classification performance.

References

  • Adeyemo A. and Wimmer H. (2018). Effects of Normalization Techniques on Logistic Regression in Data Science. 2018 Proceedings of the Conference on Information Systems Applied Research Norfolk, Virginia
  • Akdemir B. (2009). Tahmin uygulamalarında performans geliştirmek için kullanılan normalizasyon metotlarına yeni bir yaklaşım, Selçuk Üniversitesi Fen Bilimleri Enstitüsü, Doktora Tezi
  • Atomi V. H (2012). The effect of data preprocessing on the performance of artificial neural networks techniques for classification problem, Master Thesis, Faculty of Computer Science and Information Technology, University Tun Hussein Onn Malaysia
  • Bolandraftar M., Imandoust S. B. (2013). Application of K-Nearest Neighbor (KNN) Approach for Predicting Economic Events: Theoretical Background, S B Imandoust et al. Int. Journal of Engineering Research and Applications, Vol:3, Issue 5, 605-610.
  • Çalış A., Kayapınar S., Çetinyokuş T. (2014). Veri madenciliğinde karar ağacı algoritmaları ile bilgisayar ve internet güvenliği üzerine bir uygulama. Endüstri Mühendisliği Dergisi, Cilt:25, Sayı: 3-4,2-19.
  • Çalışkan S. B., Soğukpınar İ. (2008). k-means ve k en yakın komşu yöntemleri ile ağlarda nüfuz tespiti
  • Eesa A.S., Arabo W. K. (2017). Normalization methods for backpropagation: A comparative study, Science Journal of University of Zakho, Vol:5, No:4, 314-318.
  • Gautam R., Vanga S., Ariese F., Umapathy S. (2015). Review of multidimensional data processing approaches for Raman and infrared spectroscopy. EPJ Techniques and Instrumentation, 2:8,2015. DOI: 10.1140/epjti/s40485-015-0018-6
  • https://e-abm.com/how-to-establish-quality-and-correctness-of-classification-models-part-3-confusion-matrix/
  • https://en.wikipedia.org/wiki/Orange_(software)
  • http://kod5.org/yapay-sinir-aglari-ysa-nedir/
  • https://kodedu.com/2014/05/naive-bayes siniflandirma-algoritmasi/
  • https://medium.com/@ekrem.hatipoglu/machine- learning-prediction-algorithms-decision-tree-random-forest-part-5-2970905c021e.
  • https://medium.com/@k.ulgen90/makine%C3%B6%C4%9FFrenimib%C3%B6I%C3%BCm-5-karar-a%C4%F9a%C3%A7lar%C4%B1-c90bd7593010
  • https://orangedatamining.com/widget-catalog/
  • https://orangedatamining.com/download/#windows
  • http://www.iitmandi.ac.in/ciare/files/7_Anand_ANN.pdf
  • Jadhav S. D., Channe H. P. (2013). Comparative study of k-nn, naive bayes and decision tree classification techniques, International Journal of Science and Research (IJSR)
  • Kavzoğlu T. ve Çölkesen İ. (2010). Destek vektör makineleri ile uydu görüntülerinin sınıflandırılmasında kernel fonksiyonlarının etkilerinin incelenmesi, Harita Dergisi, Sayı 144
  • Mohamed A. E. (2017). Comparative study of four supervised machine learning techniques for classification. International Journal of Applied Science and Technology, Vol:7, No:2
  • Muthuselvan S., Rajapraksh S., Somasundaram K, KKarthik K. (2018). Classification of Liver Patient Dataset Using Machine Learning Algorithms, International Journal of Engineering & Technology, 7 (3.34), 323-326.
  • Polat K. (2008). Biyomedikal sinyallerde veri ön-işleme tekniklerinin medikal teşhiste sınıflama doğruluğuna etkisinin incelenmesi. Selçuk Üniversitesi Fen Bilimleri Enstitüsü, Doktora tezi
  • Shalabi, L.A., Z. Shaaban and Kasasbeh, B. (2006). Data Mining: A Preprocessing Engine, J. Comput. Sci., 2: 735-739
  • Singh B K, Thoke A. S. and Verma K. (2015). Investigations on Impact of Feature Normalization Techniques on Classifier’s Performance in Breast Tumor Classification, International Journal of Computer Applications (ISSN: 0975 – 8887) Volume 116 – No. 19, 11-15.
  • www.codecademy.com/articles/normalization
  • Yavuz S., Deveci M. (2012). İstatiksel normalizasyon tekniklerinin yapay sinir ağın performansına etkisi, Erciyes Üniversitesi İktisadi ve İdari Bilimler Dergisi, Sayı 40, 167-187.
  • Yazıcı A. C., Öğüş E., Ankaralı S., Canan S., Ankaralı H., Akkuş Z. (2007). Yapay sinir ağlarına genel bakış, Turkiye Klinikleri J Med Sci, 27:65-71.
  • Yüce H. (2021). Normalizasyon tekniklerinin biyomedikal verilerde sınıflama başarısına etkisi, Necmettin Erbakan Üniversitesi Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi.
There are 28 citations in total.

Details

Primary Language Turkish
Subjects Engineering
Journal Section Articles
Authors

Hakan Yüce 0000-0003-3275-1944

Ali Osman Özkan 0000-0002-2226-9786

Publication Date December 15, 2021
Published in Issue Year 2021 Issue: 30

Cite

APA Yüce, H., & Özkan, A. O. (2021). Normalizasyon Yöntemlerinin Biyomedikal Verilerde Sınıflandırma Performansına Etkisi. Avrupa Bilim Ve Teknoloji Dergisi(30), 35-43. https://doi.org/10.31590/ejosat.1011723