Araştırma Makalesi
BibTex RIS Kaynak Göster

Normalizasyon Yöntemlerinin Biyomedikal Verilerde Sınıflandırma Performansına Etkisi

Yıl 2021, , 35 - 43, 15.12.2021
https://doi.org/10.31590/ejosat.1011723

Öz

Günümüzde tıpta hastalıklarla ilgili veri miktarı artmakta ve bu verilerden hastalığın sınıfı hakkında tahminler yapılmaktadır. Bu tahminlere için olumlu sonuç sağlayabilecek teknikler üzerinde çalışmalar geliştirilmektedir. Bu tahminler için kullanılacak olan sınıflandırma algoritmaları bu tekniklerle daha doğru sınıflandırma başarısı gösterebilmektedir. Bu çalışmada karaciğer ve kalp hastalığı veri setleri ondalık ölçekleme, minimum maksimum, z-skor ve norm normalizasyon yöntemleriyle normalize edilmiştir. Daha sonra bu normalize edilen veriler ve ham verilere, 4 farklı k-kat çapraz değerlendirmede (2,5,10,20) yapay sinir ağları, Naive Bayes, destek vektör makinesi, k-NN ve karar ağacı gibi çeşitli sınıflandırma algoritmalarıyla ORANGE programı kullanılarak sınıflandırma işlemine tabi tutulmuştur. Verilerin sınıflama doğrulukları değerlendirilmiş ve normalizasyon yöntemlerinin sınıflandırma performansını artırdığı gözlemlenmiştir.

Kaynakça

  • Adeyemo A. and Wimmer H. (2018). Effects of Normalization Techniques on Logistic Regression in Data Science. 2018 Proceedings of the Conference on Information Systems Applied Research Norfolk, Virginia
  • Akdemir B. (2009). Tahmin uygulamalarında performans geliştirmek için kullanılan normalizasyon metotlarına yeni bir yaklaşım, Selçuk Üniversitesi Fen Bilimleri Enstitüsü, Doktora Tezi
  • Atomi V. H (2012). The effect of data preprocessing on the performance of artificial neural networks techniques for classification problem, Master Thesis, Faculty of Computer Science and Information Technology, University Tun Hussein Onn Malaysia
  • Bolandraftar M., Imandoust S. B. (2013). Application of K-Nearest Neighbor (KNN) Approach for Predicting Economic Events: Theoretical Background, S B Imandoust et al. Int. Journal of Engineering Research and Applications, Vol:3, Issue 5, 605-610.
  • Çalış A., Kayapınar S., Çetinyokuş T. (2014). Veri madenciliğinde karar ağacı algoritmaları ile bilgisayar ve internet güvenliği üzerine bir uygulama. Endüstri Mühendisliği Dergisi, Cilt:25, Sayı: 3-4,2-19.
  • Çalışkan S. B., Soğukpınar İ. (2008). k-means ve k en yakın komşu yöntemleri ile ağlarda nüfuz tespiti
  • Eesa A.S., Arabo W. K. (2017). Normalization methods for backpropagation: A comparative study, Science Journal of University of Zakho, Vol:5, No:4, 314-318.
  • Gautam R., Vanga S., Ariese F., Umapathy S. (2015). Review of multidimensional data processing approaches for Raman and infrared spectroscopy. EPJ Techniques and Instrumentation, 2:8,2015. DOI: 10.1140/epjti/s40485-015-0018-6
  • https://e-abm.com/how-to-establish-quality-and-correctness-of-classification-models-part-3-confusion-matrix/
  • https://en.wikipedia.org/wiki/Orange_(software)
  • http://kod5.org/yapay-sinir-aglari-ysa-nedir/
  • https://kodedu.com/2014/05/naive-bayes siniflandirma-algoritmasi/
  • https://medium.com/@ekrem.hatipoglu/machine- learning-prediction-algorithms-decision-tree-random-forest-part-5-2970905c021e.
  • https://medium.com/@k.ulgen90/makine%C3%B6%C4%9FFrenimib%C3%B6I%C3%BCm-5-karar-a%C4%F9a%C3%A7lar%C4%B1-c90bd7593010
  • https://orangedatamining.com/widget-catalog/
  • https://orangedatamining.com/download/#windows
  • http://www.iitmandi.ac.in/ciare/files/7_Anand_ANN.pdf
  • Jadhav S. D., Channe H. P. (2013). Comparative study of k-nn, naive bayes and decision tree classification techniques, International Journal of Science and Research (IJSR)
  • Kavzoğlu T. ve Çölkesen İ. (2010). Destek vektör makineleri ile uydu görüntülerinin sınıflandırılmasında kernel fonksiyonlarının etkilerinin incelenmesi, Harita Dergisi, Sayı 144
  • Mohamed A. E. (2017). Comparative study of four supervised machine learning techniques for classification. International Journal of Applied Science and Technology, Vol:7, No:2
  • Muthuselvan S., Rajapraksh S., Somasundaram K, KKarthik K. (2018). Classification of Liver Patient Dataset Using Machine Learning Algorithms, International Journal of Engineering & Technology, 7 (3.34), 323-326.
  • Polat K. (2008). Biyomedikal sinyallerde veri ön-işleme tekniklerinin medikal teşhiste sınıflama doğruluğuna etkisinin incelenmesi. Selçuk Üniversitesi Fen Bilimleri Enstitüsü, Doktora tezi
  • Shalabi, L.A., Z. Shaaban and Kasasbeh, B. (2006). Data Mining: A Preprocessing Engine, J. Comput. Sci., 2: 735-739
  • Singh B K, Thoke A. S. and Verma K. (2015). Investigations on Impact of Feature Normalization Techniques on Classifier’s Performance in Breast Tumor Classification, International Journal of Computer Applications (ISSN: 0975 – 8887) Volume 116 – No. 19, 11-15.
  • www.codecademy.com/articles/normalization
  • Yavuz S., Deveci M. (2012). İstatiksel normalizasyon tekniklerinin yapay sinir ağın performansına etkisi, Erciyes Üniversitesi İktisadi ve İdari Bilimler Dergisi, Sayı 40, 167-187.
  • Yazıcı A. C., Öğüş E., Ankaralı S., Canan S., Ankaralı H., Akkuş Z. (2007). Yapay sinir ağlarına genel bakış, Turkiye Klinikleri J Med Sci, 27:65-71.
  • Yüce H. (2021). Normalizasyon tekniklerinin biyomedikal verilerde sınıflama başarısına etkisi, Necmettin Erbakan Üniversitesi Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi.

Effect of Normalization Techniques on Classification Success in Biomedical Data

Yıl 2021, , 35 - 43, 15.12.2021
https://doi.org/10.31590/ejosat.1011723

Öz

Nowadays, the amount of data about diseases in medicine is increasing and predictions about the class of the disease are made from these data. Studies are being developed on techniques that can provide positive results for these predictions. Classification algorithms that will make these predictions can show more accurate classification success with these techniques. In this study, liver and heart disease data sets were normalized using decimal scaling, minimum maximum, z-score and norm normalization methods. Then, these normalized datas and raw datas are classified using the ORANGE program with various classification algorithms such as artificial neural networks, decision tree, support vector machine, k-NN and Naive Bayes in 4 different k-fold cross validation (2,5,10,20) has been processed. The classification accuracies of the data were evaluated and were observed that normalization methods increased the classification performance.

Kaynakça

  • Adeyemo A. and Wimmer H. (2018). Effects of Normalization Techniques on Logistic Regression in Data Science. 2018 Proceedings of the Conference on Information Systems Applied Research Norfolk, Virginia
  • Akdemir B. (2009). Tahmin uygulamalarında performans geliştirmek için kullanılan normalizasyon metotlarına yeni bir yaklaşım, Selçuk Üniversitesi Fen Bilimleri Enstitüsü, Doktora Tezi
  • Atomi V. H (2012). The effect of data preprocessing on the performance of artificial neural networks techniques for classification problem, Master Thesis, Faculty of Computer Science and Information Technology, University Tun Hussein Onn Malaysia
  • Bolandraftar M., Imandoust S. B. (2013). Application of K-Nearest Neighbor (KNN) Approach for Predicting Economic Events: Theoretical Background, S B Imandoust et al. Int. Journal of Engineering Research and Applications, Vol:3, Issue 5, 605-610.
  • Çalış A., Kayapınar S., Çetinyokuş T. (2014). Veri madenciliğinde karar ağacı algoritmaları ile bilgisayar ve internet güvenliği üzerine bir uygulama. Endüstri Mühendisliği Dergisi, Cilt:25, Sayı: 3-4,2-19.
  • Çalışkan S. B., Soğukpınar İ. (2008). k-means ve k en yakın komşu yöntemleri ile ağlarda nüfuz tespiti
  • Eesa A.S., Arabo W. K. (2017). Normalization methods for backpropagation: A comparative study, Science Journal of University of Zakho, Vol:5, No:4, 314-318.
  • Gautam R., Vanga S., Ariese F., Umapathy S. (2015). Review of multidimensional data processing approaches for Raman and infrared spectroscopy. EPJ Techniques and Instrumentation, 2:8,2015. DOI: 10.1140/epjti/s40485-015-0018-6
  • https://e-abm.com/how-to-establish-quality-and-correctness-of-classification-models-part-3-confusion-matrix/
  • https://en.wikipedia.org/wiki/Orange_(software)
  • http://kod5.org/yapay-sinir-aglari-ysa-nedir/
  • https://kodedu.com/2014/05/naive-bayes siniflandirma-algoritmasi/
  • https://medium.com/@ekrem.hatipoglu/machine- learning-prediction-algorithms-decision-tree-random-forest-part-5-2970905c021e.
  • https://medium.com/@k.ulgen90/makine%C3%B6%C4%9FFrenimib%C3%B6I%C3%BCm-5-karar-a%C4%F9a%C3%A7lar%C4%B1-c90bd7593010
  • https://orangedatamining.com/widget-catalog/
  • https://orangedatamining.com/download/#windows
  • http://www.iitmandi.ac.in/ciare/files/7_Anand_ANN.pdf
  • Jadhav S. D., Channe H. P. (2013). Comparative study of k-nn, naive bayes and decision tree classification techniques, International Journal of Science and Research (IJSR)
  • Kavzoğlu T. ve Çölkesen İ. (2010). Destek vektör makineleri ile uydu görüntülerinin sınıflandırılmasında kernel fonksiyonlarının etkilerinin incelenmesi, Harita Dergisi, Sayı 144
  • Mohamed A. E. (2017). Comparative study of four supervised machine learning techniques for classification. International Journal of Applied Science and Technology, Vol:7, No:2
  • Muthuselvan S., Rajapraksh S., Somasundaram K, KKarthik K. (2018). Classification of Liver Patient Dataset Using Machine Learning Algorithms, International Journal of Engineering & Technology, 7 (3.34), 323-326.
  • Polat K. (2008). Biyomedikal sinyallerde veri ön-işleme tekniklerinin medikal teşhiste sınıflama doğruluğuna etkisinin incelenmesi. Selçuk Üniversitesi Fen Bilimleri Enstitüsü, Doktora tezi
  • Shalabi, L.A., Z. Shaaban and Kasasbeh, B. (2006). Data Mining: A Preprocessing Engine, J. Comput. Sci., 2: 735-739
  • Singh B K, Thoke A. S. and Verma K. (2015). Investigations on Impact of Feature Normalization Techniques on Classifier’s Performance in Breast Tumor Classification, International Journal of Computer Applications (ISSN: 0975 – 8887) Volume 116 – No. 19, 11-15.
  • www.codecademy.com/articles/normalization
  • Yavuz S., Deveci M. (2012). İstatiksel normalizasyon tekniklerinin yapay sinir ağın performansına etkisi, Erciyes Üniversitesi İktisadi ve İdari Bilimler Dergisi, Sayı 40, 167-187.
  • Yazıcı A. C., Öğüş E., Ankaralı S., Canan S., Ankaralı H., Akkuş Z. (2007). Yapay sinir ağlarına genel bakış, Turkiye Klinikleri J Med Sci, 27:65-71.
  • Yüce H. (2021). Normalizasyon tekniklerinin biyomedikal verilerde sınıflama başarısına etkisi, Necmettin Erbakan Üniversitesi Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi.
Toplam 28 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Mühendislik
Bölüm Makaleler
Yazarlar

Hakan Yüce 0000-0003-3275-1944

Ali Osman Özkan 0000-0002-2226-9786

Yayımlanma Tarihi 15 Aralık 2021
Yayımlandığı Sayı Yıl 2021

Kaynak Göster

APA Yüce, H., & Özkan, A. O. (2021). Normalizasyon Yöntemlerinin Biyomedikal Verilerde Sınıflandırma Performansına Etkisi. Avrupa Bilim Ve Teknoloji Dergisi(30), 35-43. https://doi.org/10.31590/ejosat.1011723