Research Article

MAKİNE ÖĞRENMESİNDE YENİDEN ÖRNEKLEME: ALGORİTMALARIN PERFORMANSLARINA YANSIMALARI

Volume: 18 Number: 1 January 30, 2025
EN TR

MAKİNE ÖĞRENMESİNDE YENİDEN ÖRNEKLEME: ALGORİTMALARIN PERFORMANSLARINA YANSIMALARI

Abstract

Farklı alanlarda çeşitli uygulamalarda kullanılan makine öğrenmesi teknikleri karmaşık problemlerin çözümünde katkı sağlayarak gelişim göstermektedir. Bu teknikler verilerin işlenmesi, anlamlandırılması ve tahmini gibi çeşitli amaçlarla kullanılmaktadır. Karmaşık problemlerin çözümünde kullanılan sınıflandırma algoritmalarında giriş değerleri üzerinden etiketlenmiş çıkış değerleri tahmin edilmektedir. Ancak bu tür makine öğrenmesi uygulamalarında küme sayılarının dengesiz dağılımlarına bağlı olarak performans kayıpları yaşanmaktadır. Bu performans kayıplarının önüne geçmek amacıyla çeşitli yeniden örnekleme yöntemleri kullanılmaktadır. Alt örnekleme ve aşırı örnekleme olmak üzere iki farklı grupta ele alınan bu yöntemler veri setlerinde yer alan dengesizlikleri ortadan kaldırmak için sıklıkla kullanılır. Alt örnekleme yöntemleri kayıt sayısını sınıf sayısı düşük olan kayıtların sayısına yaklaştırmak amacıyla kullanılır. Aşırı örnekleme yöntemleri ise sınıf sayısı düşük olan kayıtların sayısını yükseltmek amacıyla kullanılır. Bu çalışma kapsamında çeşitli yeniden örnekleme yöntemlerinin makine öğrenmesi algoritmalarının performansları üzerindeki etkisinin ortaya konması amaçlanarak 569 kayıttan oluşan veri seti kullanılmıştır. İyi huylu ve kötü huylu olmak üzere iki farklı sınıftan oluşan göğüs kanseri kayıtlarına çeşitli yeniden örnekleme filtreleri uygulanmıştır. Sonrasında elde edilen veri setlerine dört farklı algoritma uygulanarak elde edilen performans metrikleri karşılaştırılarak sunulmuştur. Yapılan uygulamalar sonucunda yeniden örnekleme yöntemlerinin kullanımının makine öğrenmesi algoritmalarının performanslarına olumlu katkı sağladığı görülmüştür.

Keywords

Makine Öğrenmesi, Yeniden Örnekleme, Sınıflandırma, Performans Metrikleri

References

  1. Alahmari, F. (2020). A comparison of resampling techniques for medical data using machine learning. Journal of Information & Knowledge Management, 19(01), 2040016.
  2. Aydın, M. A. (2022). Müşteri Kaybı Tahmininde Sınıf Dengesizliği Problemi. Politeknik Dergisi, 2022, 25 (1), 351-360.
  3. Caruana, R., & Niculescu-Mizil, A. (2006). Denetimli öğrenme algoritmalarının ampirik bir karşılaştırması. 23. Uluslararası Makine Öğrenimi Konferansı Bildiri Kitabı, s. 161-168.
  4. Cover, T., & Hart, P. (1967). Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13(1), 21–27.
  5. Dua, D., & Graff, C. (2019). “UCI ML Repository [http://archive.ics.uci.edu/ml]. Irvine, CA: University of California, School of Information and Computer Science, 2019.
  6. Ercire, M., Ünsal, A. (2021). Kısa süreli güç kalitesi bozulmalarının dalgacık analizi ve rastgele orman yöntemi ile sınıflandırılması. Uludağ Üniversitesi Mühendislik Fakültesi Dergisi, 26(3), 903-920.
  7. Estabrooks, A., Jo, T., & Japkowicz, N. (2004). A multiple resampling method for learning from imbalanced data sets. Computational intelligence, 20(1), 18-36.
  8. Fernández, A., Garcia, S., Herrera, F., & Chawla, N. V. (2018). SMOTE for learning from imbalanced data: progress and challenges, marking the 15-year anniversary. Journal of Artificial Intelligence Research, 61, 863-905.
  9. Ghorbani, R., & Ghousi, R. (2020). Comparing different resampling methods in predicting students’ performance using machine learning techniques. IEEE Access, 8, 67899-67911.
  10. Goy, G., Gezer, C., & Gungor, V. C. (2019, September). Credit Card Fraud Detection with Machine Learning Methods. In 2019 4th International Conference on Computer Science and Engineering (UBMK), pp. 350-354. IEEE.
APA
Yavuz, Ö. Ç. (2025). MAKİNE ÖĞRENMESİNDE YENİDEN ÖRNEKLEME: ALGORİTMALARIN PERFORMANSLARINA YANSIMALARI. Ömer Halisdemir Üniversitesi İktisadi Ve İdari Bilimler Fakültesi Dergisi, 18(1), 292-304. https://doi.org/10.25287/ohuiibf.1539535
AMA
1.Yavuz ÖÇ. MAKİNE ÖĞRENMESİNDE YENİDEN ÖRNEKLEME: ALGORİTMALARIN PERFORMANSLARINA YANSIMALARI. Ömer Halisdemir Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi. 2025;18(1):292-304. doi:10.25287/ohuiibf.1539535
Chicago
Yavuz, Ömer Çağrı. 2025. “MAKİNE ÖĞRENMESİNDE YENİDEN ÖRNEKLEME: ALGORİTMALARIN PERFORMANSLARINA YANSIMALARI”. Ömer Halisdemir Üniversitesi İktisadi Ve İdari Bilimler Fakültesi Dergisi 18 (1): 292-304. https://doi.org/10.25287/ohuiibf.1539535.
EndNote
Yavuz ÖÇ (January 1, 2025) MAKİNE ÖĞRENMESİNDE YENİDEN ÖRNEKLEME: ALGORİTMALARIN PERFORMANSLARINA YANSIMALARI. Ömer Halisdemir Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi 18 1 292–304.
IEEE
[1]Ö. Ç. Yavuz, “MAKİNE ÖĞRENMESİNDE YENİDEN ÖRNEKLEME: ALGORİTMALARIN PERFORMANSLARINA YANSIMALARI”, Ömer Halisdemir Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, vol. 18, no. 1, pp. 292–304, Jan. 2025, doi: 10.25287/ohuiibf.1539535.
ISNAD
Yavuz, Ömer Çağrı. “MAKİNE ÖĞRENMESİNDE YENİDEN ÖRNEKLEME: ALGORİTMALARIN PERFORMANSLARINA YANSIMALARI”. Ömer Halisdemir Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi 18/1 (January 1, 2025): 292-304. https://doi.org/10.25287/ohuiibf.1539535.
JAMA
1.Yavuz ÖÇ. MAKİNE ÖĞRENMESİNDE YENİDEN ÖRNEKLEME: ALGORİTMALARIN PERFORMANSLARINA YANSIMALARI. Ömer Halisdemir Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi. 2025;18:292–304.
MLA
Yavuz, Ömer Çağrı. “MAKİNE ÖĞRENMESİNDE YENİDEN ÖRNEKLEME: ALGORİTMALARIN PERFORMANSLARINA YANSIMALARI”. Ömer Halisdemir Üniversitesi İktisadi Ve İdari Bilimler Fakültesi Dergisi, vol. 18, no. 1, Jan. 2025, pp. 292-04, doi:10.25287/ohuiibf.1539535.
Vancouver
1.Ömer Çağrı Yavuz. MAKİNE ÖĞRENMESİNDE YENİDEN ÖRNEKLEME: ALGORİTMALARIN PERFORMANSLARINA YANSIMALARI. Ömer Halisdemir Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi. 2025 Jan. 1;18(1):292-304. doi:10.25287/ohuiibf.1539535