Research Article

Veri Ölçekleme ve Eksik Veri Tamamlama Yöntemlerinin Makine Öğrenmesi Yöntemlerinin Başarısına Etkisinin İncelenmesi

Volume: 11 Number: 1 January 31, 2023
EN TR

Veri Ölçekleme ve Eksik Veri Tamamlama Yöntemlerinin Makine Öğrenmesi Yöntemlerinin Başarısına Etkisinin İncelenmesi

Abstract

Teknoloji ve bilişim alanındaki yenilikler ile elde edilen verinin büyüklüğü ve çeşitliliği artarak bu verilerin kaydedilmesi ve paylaşılması da kolaylaşmıştır. İnsan eli ile analiz edilmesi oldukça zor olan bu verilerin analizinde bilgisayarlar ve özellikle makine öğrenmesi algoritmaları büyük rol oynamaktadır. Bu analiz sürecinde veri ön işleme aşaması veri üzerinde yapılan çalışmalarda kilit rol oynamaktadır. Veri ön işleme aşamasında eksik verilerin tamamlanması ve veri ölçekleme işlemi gerçekleştirilmektedir. Literatürde eksik veri tamamlaması ile veri ölçekleme yöntemlerinin algoritmalar üzerindeki etkisini ayrı ayrı gösteren çalışmalar bulunmaktadır. Fakat bu iki önemli aşamanın bir arada değerlendirilmesi de gerekmektedir. Bu çalışmada Hepatoselüler Karsinoma (HCC) hastalığı veri seti üzerinde eksik verilerin tamamlanması ve veri ölçekleme yaklaşımlarının Yapay Sinir Ağları, Destek Vektör Makinaları ve Rassal Orman Algoritmalarının sınıflandırma başarılarına etkisi araştırılmıştır. Araştırma sonucunda en iyi sınıflandırmanın eksik verilerin tamamlanmasında ortalama yaklaşımı kullanılması ve min-max veri ölçeklemesi ile gerçekleştiği tespit edilmiştir. Ayrıca sınıflandırma açısından Rassal Orman algoritmasının diğer algoritmalara göre daha başarılı olduğu tespit edilmiştir

Keywords

References

  1. [1] E. Sezgin and Y. Çelik, “Veri madenciliğinde kayıp veriler için kullanılan yöntemlerin karşılaştırılması,” XV. Akademik Bilişim Konferansı Bildirileri, Antalya, Türkiye, 2013, ss.194-198.
  2. [2] T. Jayalakshmi and A. Santhakumaran, “Statistical Normalization and Back Propagationfor Classification”, International Journal of Computer Theory and Engineering vol.3, no.1, pp.793-8201, 2011
  3. [3] S. H. Caldwell, D. M. Crespo, H. S. Kang, and A. M. S. Al-Osaimi, “Obesity and hepatocellular carcinoma”, In Gastroenterology, vol. 127, no.5, pp.97–103, 2004.
  4. [4] J. Jose, G.K. Vishwakarma, A. Bhattacharjee, “Illustration of missing data handling technique generated from hepatitis C induced hepatocellular carcinoma cohort study”, Journal of King Saud University - Science. vol.33, no.4, 2021.
  5. [5] M. Yumus, M. Apaydin, A. Degirmenci, O. Karal, “Missing data imputation using machine learning based methods to improve HCC survival prediction”, 28th Signal Processing and Communications Applications Conference (SIU), Gaziantep, Türkiye, 2020, ss.1-4.
  6. [6] F.B. Demir, T. Tuncer, A.F. Kocamaz, F. Ertam, “A survival classification method for hepatocellular carcinoma patients with chaotic Darcy optimization method based feature selection”, Medical Hypotheses, vol.139, 2020.
  7. [7] S. Han, A.C. Andrei, K.W. Tsui, Multiple imputation for competing risks survival data via pseudo-observations, Communications for statistical applications and methods, vol.25 , pp. 385–396, 2018.
  8. [8] M.S. Santos, P.H. Abreu, P.J. García-Laencina, A. Simão, A. Carvalho, A new cluster-based oversampling method for improving survival prediction of hepatocellular carcinoma patients, Journal of Biomedical Informatics, vol.58 pp.49–59, 2015.

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Research Article

Publication Date

January 31, 2023

Submission Date

June 6, 2021

Acceptance Date

March 15, 2022

Published in Issue

Year 2023 Volume: 11 Number: 1

APA
Polatgil, M. (2023). Veri Ölçekleme ve Eksik Veri Tamamlama Yöntemlerinin Makine Öğrenmesi Yöntemlerinin Başarısına Etkisinin İncelenmesi. Duzce University Journal of Science and Technology, 11(1), 78-88. https://doi.org/10.29130/dubited.948564
AMA
1.Polatgil M. Veri Ölçekleme ve Eksik Veri Tamamlama Yöntemlerinin Makine Öğrenmesi Yöntemlerinin Başarısına Etkisinin İncelenmesi. DUBİTED. 2023;11(1):78-88. doi:10.29130/dubited.948564
Chicago
Polatgil, Mesut. 2023. “Veri Ölçekleme Ve Eksik Veri Tamamlama Yöntemlerinin Makine Öğrenmesi Yöntemlerinin Başarısına Etkisinin İncelenmesi”. Duzce University Journal of Science and Technology 11 (1): 78-88. https://doi.org/10.29130/dubited.948564.
EndNote
Polatgil M (January 1, 2023) Veri Ölçekleme ve Eksik Veri Tamamlama Yöntemlerinin Makine Öğrenmesi Yöntemlerinin Başarısına Etkisinin İncelenmesi. Duzce University Journal of Science and Technology 11 1 78–88.
IEEE
[1]M. Polatgil, “Veri Ölçekleme ve Eksik Veri Tamamlama Yöntemlerinin Makine Öğrenmesi Yöntemlerinin Başarısına Etkisinin İncelenmesi”, DUBİTED, vol. 11, no. 1, pp. 78–88, Jan. 2023, doi: 10.29130/dubited.948564.
ISNAD
Polatgil, Mesut. “Veri Ölçekleme Ve Eksik Veri Tamamlama Yöntemlerinin Makine Öğrenmesi Yöntemlerinin Başarısına Etkisinin İncelenmesi”. Duzce University Journal of Science and Technology 11/1 (January 1, 2023): 78-88. https://doi.org/10.29130/dubited.948564.
JAMA
1.Polatgil M. Veri Ölçekleme ve Eksik Veri Tamamlama Yöntemlerinin Makine Öğrenmesi Yöntemlerinin Başarısına Etkisinin İncelenmesi. DUBİTED. 2023;11:78–88.
MLA
Polatgil, Mesut. “Veri Ölçekleme Ve Eksik Veri Tamamlama Yöntemlerinin Makine Öğrenmesi Yöntemlerinin Başarısına Etkisinin İncelenmesi”. Duzce University Journal of Science and Technology, vol. 11, no. 1, Jan. 2023, pp. 78-88, doi:10.29130/dubited.948564.
Vancouver
1.Mesut Polatgil. Veri Ölçekleme ve Eksik Veri Tamamlama Yöntemlerinin Makine Öğrenmesi Yöntemlerinin Başarısına Etkisinin İncelenmesi. DUBİTED. 2023 Jan. 1;11(1):78-8. doi:10.29130/dubited.948564

Cited By