Research Article

VERİ ÖN İŞLEME TEKNİKLERİNİN SAĞLIK VERİLERİNİN SINIFLANDIRMA BAŞARISINA ETKİSİNİN İNCELENMESİ

Volume: 11 Number: 24 December 31, 2024
EN TR

VERİ ÖN İŞLEME TEKNİKLERİNİN SAĞLIK VERİLERİNİN SINIFLANDIRMA BAŞARISINA ETKİSİNİN İNCELENMESİ

Abstract

Veri madenciliği sürecinin en temel adımlarından biri olan veri ön işleme teknikleri, literatürde sıklıkla başvurulan bir süreçtir. Bu çalışmada Hepatit hastalığına ait veri kümesi üzerinde sağlık alanında sık kullanılan veri ön işleme tekniklerinin etkinliği incelenmiştir. Sırasıyla eksik veri, dengesiz veri kümesi, aykırı veri, normalizasyon ve özellik seçimi işlemleri uygulanmıştır. Veri kümesinin her adımda elde edilen yeni versiyonu için literatürde sıklıkla kullanılan beş makine öğrenmesi yöntemi (KNN, LR, RF, SVM, ANN) ile sınıflandırma yapılmıştır. Elde edilen sonuçlar, doğru ve gerekli veri ön işleme tekniklerinin seçimi ile model başarısına olumlu katkısını desteklemektedir. Tüm aşama sonunda elde edilen model performansları %85 ve üzerinde olup, tüm performans belirleme ölçütleri bazında tutarlı sonuçlar göstermektedir. Her bir veri ön işleme model performansına kademeli olarak katkıda bulunmuş, en yüksek katkı ise son aşamada uygulanan özellik seçimi ile sağlanmıştır. Özellik seçimi, modelin performansını belirgin şekilde iyileştirerek sınıflandırma başarısına önemli ölçüde katkı sağlamıştır.

Keywords

Sağlık Veri Kümesi, Hepatit, Makine Öğrenmesi, Veri Ön İşleme

References

  1. Erdoğan F. İkili gri kurt optimizasyon algoritmasinin ikili optimizasyon problemlerine uygulanmasi. Yüksek lisans tezi. Konya: Necmettin Erbakan Üniversitesi; 2023.
  2. Li J, Cheng K, Wang S, Morstatter F, Trevino RP, Tang J, Liu H. Feature selection: A data perspective. ACM Computing Surveys (CSUR) 2017; 50(6): 1-45.
  3. Dogan A, Birant D. Machine learning and data mining in manufacturing. Expert Systems with Applications 2021; 166: 1-22.
  4. Oğuzlar A. Veri ön işleme. Erciyes Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi 2003; 21: 67-76.
  5. Nart A. Kalp hastaliklarini tahmin etmede veri madenciliği teknikleriyle etkili algoritmanin tespit edilmesi. Yüksek lisans tezi. Ankara: Gazi Üniversitesi; 2023.
  6. García S, Luengo J, Herrera F. Data preprocessing in data mining. 72 Cham, Switzerland:Springer; 2015.
  7. García S, Ramírez-Gallego S, Luengo J, Benítez JM, Herrera F. Big data preprocessing: methods and prospects. Big Data Analytics 2016; 1: 1-22.
  8. Zelaya CVG. Towards explaining the effects of data preprocessing on machine learning. In: IEEE 35th International Conference on Data Engineering (ICDE), Macau SAR, China; 2019.
  9. Özoğur HN, Orman Z. Sağlik verilerinin analizinde veri ön işleme adimlarinin makine öğrenmesi yöntemlerinin performansina etkisi. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 2023; 16(1): 23-33.
  10. Saygın E, Baykara M. Karaciğer yetmezliği teşhisinde özellik seçimi kullanarak makine öğrenmesi yöntemlerinin başarılarının ölçülmesi. Fırat Üniversitesi Mühendislik Bilimleri Dergisi 2021; 33(2): 367-377.
APA
Erdoğan, F., Tongur, V., & Uzbaş, B. (2024). VERİ ÖN İŞLEME TEKNİKLERİNİN SAĞLIK VERİLERİNİN SINIFLANDIRMA BAŞARISINA ETKİSİNİN İNCELENMESİ. Adıyaman Üniversitesi Mühendislik Bilimleri Dergisi, 11(24), 475-488. https://doi.org/10.54365/adyumbd.1466631
AMA
1.Erdoğan F, Tongur V, Uzbaş B. VERİ ÖN İŞLEME TEKNİKLERİNİN SAĞLIK VERİLERİNİN SINIFLANDIRMA BAŞARISINA ETKİSİNİN İNCELENMESİ. Adıyaman Üniversitesi Mühendislik Bilimleri Dergisi. 2024;11(24):475-488. doi:10.54365/adyumbd.1466631
Chicago
Erdoğan, Feyza, Vahit Tongur, and Betül Uzbaş. 2024. “VERİ ÖN İŞLEME TEKNİKLERİNİN SAĞLIK VERİLERİNİN SINIFLANDIRMA BAŞARISINA ETKİSİNİN İNCELENMESİ”. Adıyaman Üniversitesi Mühendislik Bilimleri Dergisi 11 (24): 475-88. https://doi.org/10.54365/adyumbd.1466631.
EndNote
Erdoğan F, Tongur V, Uzbaş B (December 1, 2024) VERİ ÖN İŞLEME TEKNİKLERİNİN SAĞLIK VERİLERİNİN SINIFLANDIRMA BAŞARISINA ETKİSİNİN İNCELENMESİ. Adıyaman Üniversitesi Mühendislik Bilimleri Dergisi 11 24 475–488.
IEEE
[1]F. Erdoğan, V. Tongur, and B. Uzbaş, “VERİ ÖN İŞLEME TEKNİKLERİNİN SAĞLIK VERİLERİNİN SINIFLANDIRMA BAŞARISINA ETKİSİNİN İNCELENMESİ”, Adıyaman Üniversitesi Mühendislik Bilimleri Dergisi, vol. 11, no. 24, pp. 475–488, Dec. 2024, doi: 10.54365/adyumbd.1466631.
ISNAD
Erdoğan, Feyza - Tongur, Vahit - Uzbaş, Betül. “VERİ ÖN İŞLEME TEKNİKLERİNİN SAĞLIK VERİLERİNİN SINIFLANDIRMA BAŞARISINA ETKİSİNİN İNCELENMESİ”. Adıyaman Üniversitesi Mühendislik Bilimleri Dergisi 11/24 (December 1, 2024): 475-488. https://doi.org/10.54365/adyumbd.1466631.
JAMA
1.Erdoğan F, Tongur V, Uzbaş B. VERİ ÖN İŞLEME TEKNİKLERİNİN SAĞLIK VERİLERİNİN SINIFLANDIRMA BAŞARISINA ETKİSİNİN İNCELENMESİ. Adıyaman Üniversitesi Mühendislik Bilimleri Dergisi. 2024;11:475–488.
MLA
Erdoğan, Feyza, et al. “VERİ ÖN İŞLEME TEKNİKLERİNİN SAĞLIK VERİLERİNİN SINIFLANDIRMA BAŞARISINA ETKİSİNİN İNCELENMESİ”. Adıyaman Üniversitesi Mühendislik Bilimleri Dergisi, vol. 11, no. 24, Dec. 2024, pp. 475-88, doi:10.54365/adyumbd.1466631.
Vancouver
1.Feyza Erdoğan, Vahit Tongur, Betül Uzbaş. VERİ ÖN İŞLEME TEKNİKLERİNİN SAĞLIK VERİLERİNİN SINIFLANDIRMA BAŞARISINA ETKİSİNİN İNCELENMESİ. Adıyaman Üniversitesi Mühendislik Bilimleri Dergisi. 2024 Dec. 1;11(24):475-88. doi:10.54365/adyumbd.1466631