Bu çalışmada bir sınıflandırma problemi veri madenciliğinde en çok kullanılan sınıflandırma yöntemleri olan Karar Ağaçları (KA), Yapay Sinir Ağları (YSA) ve Lojistik Regresyon (LR) yöntemleri kullanılarak çözülmüştür. Analizde KA’nın Entropi ve Gini İndeksleri budama yapılmak suretiyle ve YSA’nın Çok Katmanlı Algılayıcı (ÇKA) modeli ise mimarisi optimize edilerek kullanılmıştır. Uygulama, veri düzgünleştirme (SMOTE) yapılmadan önce ve sonra olmak üzere iki aşamada gerçekleştirilmiş olup sonuçlar altı farklı ölçüt (doğruluk, standart sapma, hassasiyet, geri çağırma, AUC_ROC ve F1) kullanılarak karşılaştırılmıştır. KA mevcut veri kümesi üzerinde, her iki indekste de geri çağırma ölçütü hariç altı ölçütün beşine göre en iyi sonuçları veren sınıflandırma yöntemi olmuştur. İndeks sonuçları arasındaki fark %0 ila %4 arasında çıkmıştır. SMOTE yöntemi YSA’nın sonuçlarına pozitif tesir etmiş fakat KA ve LR’un sonuçlarında en ufak bir farklılık meydana getirmemiştir. Bu sonuçlar dikkate alındığında KA, kredi riski belirlemede kullanıma uygun potansiyel bir Makine Öğrenimi (MÖ) tekniği olarak ön plana çıkmaktadır. Çalışma, yöntemlerin gerçek hayat verisi üzerinde, farklı indekslerde gerçekleştirilmiş olması ve sonuçların altı farklı kriterle ölçülmesi neticesinde, söz konusu yöntemlerin sınıflandırma yeteneklerinin sağlıklı bir kıyasını sunmaktadır.
Karar Ağaçları Yapay Sinir Ağları Lojistik Regresyon Sınıflandırma
In this study, a classification problem was solved using the most commonly used classification methods in data mining: Decision Trees (DT), Artificial Neural Networks (ANN), and Logistic Regression (LR). In the analysis, DT was applied with pruning using both the Entropy and Gini Indexes, and the ANN was used with a Multilayer Perceptron (MLP) model, where the architecture was optimized. The application was carried out in two phases: before and after data balancing (SMOTE), and the results were compared using six different metrics (accuracy, standard deviation, precision, recall, AUC-ROC, and F1 score). DT was the best-performing classification method on the existing dataset for five out of the six metrics, excluding recall, in both index measures. The difference between the index results ranged from 0% to 4%. The SMOTE method had a positive impact on the results of ANN, but it did not cause any significant difference in the results of DT or LR. Considering these results, DT stands out as a potential Machine Learning (ML) technique suitable for credit risk assessment. The study provides a healthy comparison of the classification capabilities of the methods, as they were applied to real-world data and evaluated using six different criteria.
Decision Trees Artificial Neural Networks Logistic Regression Classification
Birincil Dil | Türkçe |
---|---|
Konular | Yapay Zeka (Diğer) |
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Erken Görünüm Tarihi | 6 Eylül 2025 |
Yayımlanma Tarihi | 6 Ekim 2025 |
Gönderilme Tarihi | 29 Kasım 2024 |
Kabul Tarihi | 25 Haziran 2025 |
Yayımlandığı Sayı | Yıl 2025 Cilt: 27 Sayı: 2 |