DENGESİZ KREDİ SKORLAMA VERİ SETLERİNDE KOLEKTİF ÖĞRENME ALGORİTMALARININ PERFORMANS DEĞERLENDİRMESİ
Abstract
Amaç- Kredi skorlama modeli geliştirilirken kullanılan veri kümelerinde sınıflara ait örneklerin dengesiz bir dağılıma sahip olmalarından dolayı, modellerin doğruluk oranı düşük olmaktadır. Biz bu çalışmada kollektif öğrenme algoritmalarını maliyete duyarlı öğrenme yöntemiyle birlikte kullanarak elde edilen modellerin performansını karşılaştıp en etkin modellleri belirlemeye çalıştık.
Metodoloji- Bu amaçla Bagging ve AdaBoost kolektif öğrenme yöntemleri karar ağaçları, destek vektör makineleri ve k-NN temel sınıflandırıcıları ile iki farklı kredi veri seti üzerinde çalıştırılmıştır. Ayrıca Bagging ve AdaBoost için maliyet duyarlı öğrenme yöntemi kullanılarak azınlık sınıflandırma grubunun ceza puanı artırılmıştır. Bütün bu kombinasyonlar kıyaslanmıştır.
Bulgular- Maliyete duyarlı öğrenme yöntemlerinin kullanılması, hem AdaBoost hem de Bagging için performans değerlendirme ölçeği AUC açısından daha başarılı sonuçlar elde edilmesini sağlamıştır. Verideki sınıf dengesizlik oranının artması durumunda, karar ağaçlarının temel sınıflandırıcı olduğu Bagging kolektif yönteminin AdaBoost kolektif yöntemine göre daha yüksek başarı elde ettiği gözlemlenmiştir.
Sonuç- Başarısı yüksek etkili bir kredi skorlama yöntemi geliştirilmesi hala çözülmesi gereken bir problem olmasına rağmen kolektif öğrenme yöntemi ile oluşturulan modellerin bireysel sınıflandırıcılarılarla oluşturulan modellere göre daha yüksek başarı gösterdiği gözlemlenmiştir. Bu durum literatürdeki diğer çalışma bulgularıyla da örtüşmektedir. [Maciej Zięba ve ark., 2012]
Keywords
References
- Paleologo, Giuseppe ve ark. (2010). Subagging for credit scoring models. European Journal of Operational Research. 201 (2010) 490–499
- Wang, Gang ve ark. (2011). A comparative assessment of ensemble learning for credit scoring, Expert Systems with Applications. 38 (2011) 223 - 230
- Marqués, A.I. ve ark. (2012). Exploring the behaviour of base classifiers in credit scoring ensembles. Expert Systems with Applications. 39 (2012) 10244–10250
- Gang Wang ve ark (2012). A hybrid ensemble approach for enterprise credit risk assessment based on Support Vector Machine. Expert Systems with Applications. 39 (2012) 5325–5331
- Jin Xiao ve ark (2012). Dynamic classifier ensemble model for customer classification with imbalanced class distribution. Expert Systems with Applications 39 3668–3675
- Maciej Zięba ve ark (2012). Ensemble Classifier for Solving Credit Scoring Problems. IFIP International Federation for Information Processing, pp. 59–66
- Chih-Fong Tsai ve ark (2014). A comparative study of classifier ensembles for bankruptcy prediction. Applied Soft Computing 24 (2014) 977–984
- Tsai Chih-Fong ve ark (2014). Modeling credit scoring using neural network ensembles. Kybernetes, vol. 43, no. 7, pp. 1114-1123
Details
Primary Language
Turkish
Subjects
Finance, Business Administration
Journal Section
Research Article
Authors
Nihan Ankara
*
This is me
0000-0003-2160-210X
Hulya Sahinturk
This is me
0000-0002-3936-9441
Publication Date
July 30, 2019
Submission Date
March 27, 2019
Acceptance Date
-
Published in Issue
Year 2019 Volume: 9 Number: 1