Araştırma Makalesi

Sağlık Verilerinin Analizinde Veri Ön işleme Adımlarının Makine Öğrenmesi Yöntemlerinin Performansına Etkisi

Cilt: 16 Sayı: 1 29 Haziran 2023
PDF İndir
EN TR

Sağlık Verilerinin Analizinde Veri Ön işleme Adımlarının Makine Öğrenmesi Yöntemlerinin Performansına Etkisi

Öz

Günümüzde verilerin hızla artmasıyla makine öğrenmesi yöntemleri ile veri analizi birçok alanda popüler hale gelmiştir. Gerçek dünya veri kümelerinde eksik değerler ve dengesiz sınıf verileri sıklıkla karşılaşılan sorunlardır. Bu sorunlar, makine öğrenmesi yöntemlerinin başarımlarını olumsuz yönde etkilemekte ve modelin hatalı veya yanlış sonuçlar elde etmesine neden olmaktadır. Verilerdeki eksik değerlerin doldurulması ve sınıf dengesizliğinin ortadan kaldırılması veri ön işleme aşamasında önem arz etmektedir. Özellikle, sağlık verilerinde sınıfların dengesi verilerin doğruluğu ve eksiksizliği makine öğrenmesi yöntemlerinin performansını etkilediğinden çok önemlidir. Bu makalede, makine öğrenmesinde eksik değerlere sahip dengesiz veri sınıflandırması ile ilgili sorunları araştırmak için literatürde başarılı olan yöntemlerin karşılaştırmalı bir çalışması PIMA diyabet veri kümesi kullanılarak yapılmıştır. Elde edilen sonuçlara göre, sınıf dengesizliğinde eksik ve aşırı örnekleme yöntemlerinin birleştirildiği SMOTEENN algoritması ile eksik değerlerde zincirleme denklemlerle çoklu atama yönteminin kullanılması hasta ve sağlıklı bireylerin sınıflandırılmasında %91 F-skor değeri ile diğer en iyi yöntemlerden yaklaşık %9 oranında daha iyi performans göstermiştir

Anahtar Kelimeler

Kaynakça

  1. Fei Y., Jiazhi D., Jiying L., Weigang L., Lei Liu, Changlong Jin, and Qinma Kang. Missing value estimation methods research for arrhythmia classification using the modified kernel difference-weighted knn algorithms. BioMed research internati- onal, 2020, 2020.
  2. Ching-Hsue C., Yung-Fu K., ve Hsien-Ping L.. A financial statement fraud model based on synthesized attribute selection and a dataset with missing values and imbalanced classes. Applied Soft Computing, 108:107487, 2021.
  3. Saskya M. S., Titin S., Yoel F., Devvi S., Her-ley Shaori A., Sarah S., ve Noval S., Iterative bicluster-based bayesian principal component analysis and least squares for missing-value imputation in microarray and rna-sequencing data. Mathematical Biosciences and Engineering, 19(9):8741–8759, 2022.
  4. Seokho K. Product failure prediction with missing data using graph neural net- works. Neural computing and applications, 33(12):7225–7234, 2021.
  5. Mingjing W. ve Huiling C. Chaotic multi-swarm whale optimizer boosted support vector machine for medical diagnosis. Applied Soft Computing, 88:105946, 2020.
  6. Nizam H. Ve Saliha S. A.. Sosyal medyada makine öğrenmesi ile duygu analizinde dengeli ve dengesiz veri setlerinin performanslarının karşılaştırılması. XIX. Türkiye’de İnternet Konferansı, 1(6), 2014.
  7. Chaoliang L. and Shigang L.. A comparative study of the class imbalance problem in twitter spam detection. Concurrency and Computation: Practice and Experience, 30(5):e4281, 2018.
  8. Jinyan L., Lian-sheng L., Simon F., Raymond K W., Sabah M., Jinan F., Yunsick S., ve Kelvin KL W., Adaptive swarm balancing algorithms for rare-event prediction in imbalanced healthcare data. PloS one, 12(7):e0180830, 2017.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

29 Haziran 2023

Yayımlanma Tarihi

29 Haziran 2023

Gönderilme Tarihi

26 Ağustos 2022

Kabul Tarihi

10 Kasım 2022

Yayımlandığı Sayı

Yıl 2023 Cilt: 16 Sayı: 1

Kaynak Göster

APA
Nizam Özoğur, H., & Orman, Z. (2023). Sağlık Verilerinin Analizinde Veri Ön işleme Adımlarının Makine Öğrenmesi Yöntemlerinin Performansına Etkisi. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 16(1), 23-33. https://doi.org/10.54525/tbbmd.1167316
AMA
1.Nizam Özoğur H, Orman Z. Sağlık Verilerinin Analizinde Veri Ön işleme Adımlarının Makine Öğrenmesi Yöntemlerinin Performansına Etkisi. TBV-BBMD. 2023;16(1):23-33. doi:10.54525/tbbmd.1167316
Chicago
Nizam Özoğur, Hatice, ve Zeynep Orman. 2023. “Sağlık Verilerinin Analizinde Veri Ön işleme Adımlarının Makine Öğrenmesi Yöntemlerinin Performansına Etkisi”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 16 (1): 23-33. https://doi.org/10.54525/tbbmd.1167316.
EndNote
Nizam Özoğur H, Orman Z (01 Haziran 2023) Sağlık Verilerinin Analizinde Veri Ön işleme Adımlarının Makine Öğrenmesi Yöntemlerinin Performansına Etkisi. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 16 1 23–33.
IEEE
[1]H. Nizam Özoğur ve Z. Orman, “Sağlık Verilerinin Analizinde Veri Ön işleme Adımlarının Makine Öğrenmesi Yöntemlerinin Performansına Etkisi”, TBV-BBMD, c. 16, sy 1, ss. 23–33, Haz. 2023, doi: 10.54525/tbbmd.1167316.
ISNAD
Nizam Özoğur, Hatice - Orman, Zeynep. “Sağlık Verilerinin Analizinde Veri Ön işleme Adımlarının Makine Öğrenmesi Yöntemlerinin Performansına Etkisi”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 16/1 (01 Haziran 2023): 23-33. https://doi.org/10.54525/tbbmd.1167316.
JAMA
1.Nizam Özoğur H, Orman Z. Sağlık Verilerinin Analizinde Veri Ön işleme Adımlarının Makine Öğrenmesi Yöntemlerinin Performansına Etkisi. TBV-BBMD. 2023;16:23–33.
MLA
Nizam Özoğur, Hatice, ve Zeynep Orman. “Sağlık Verilerinin Analizinde Veri Ön işleme Adımlarının Makine Öğrenmesi Yöntemlerinin Performansına Etkisi”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, c. 16, sy 1, Haziran 2023, ss. 23-33, doi:10.54525/tbbmd.1167316.
Vancouver
1.Hatice Nizam Özoğur, Zeynep Orman. Sağlık Verilerinin Analizinde Veri Ön işleme Adımlarının Makine Öğrenmesi Yöntemlerinin Performansına Etkisi. TBV-BBMD. 01 Haziran 2023;16(1):23-3. doi:10.54525/tbbmd.1167316

Cited By

https://i.creativecommons.org/l/by-nc/4.0Makale Kabulü

 

Çevrimiçi makale yüklemesi yapmak için kullanıcı kayıt/girişini kullanınız.

Dergiye gönderilen makalelerin kabul süreci şu aşamalardan oluşmaktadır:

1.       Gönderilen her makale ilk aşamada en az iki hakeme gönderilmektedir.

2.       Hakem ataması, dergi editörleri tarafından yapılmaktadır. Derginin hakem havuzunda yaklaşık 200 hakem bulunmaktadır ve bu hakemler ilgi alanlarına göre sınıflandırılmıştır. Her hakeme ilgilendiği konuda makale gönderilmektedir. Hakem seçimi menfaat çatışmasına neden olmayacak biçimde yapılmaktadır.

3.       Hakemlere gönderilen makalelerde yazar adları kapatılmaktadır.

4.       Hakemlere bir makalenin nasıl değerlendirileceği açıklanmaktadır ve aşağıda görülen değerlendirme formunu doldurmaları istenmektedir.

5.       İki hakemin olumlu görüş bildirdiği makaleler editörler tarafından benzerlik incelemesinden geçirilir. Makalelerdeki benzerliğin %25’ten küçük olması beklenir.

6.       Tüm aşamaları geçmiş olan bir bildiri dil ve sunuş açısından editör tarafından incelenir ve gerekli düzeltme ve iyileştirmeler yapılır. Gerekirse yazarlara durum bildirilir.

 88x31.png   Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır.