Müşteri kaybı, bir müşterinin bir işletmenin sunduğu hizmetleri kullanmayı bırakmasıdır. Bankacılık sektöründe müşteri kaybının tahmini, müşteri ilişkileri yönetimi açısından büyük önem taşımaktadır. Bu çalışmada, bankaların müşteri kaybını önceden tahmin edebilmesi amacıyla makine öğrenmesi yöntemleri kullanılarak bir analiz gerçekleştirilmiştir. Kaggle'dan alınan ve Fransa, Almanya, İspanya'daki banka müşterilerine ait veri seti üzerinde lojistik regresyon, K-en yakın komşu, karar ağacı, rastgele orman, LightGBM ve CatBoost algoritmaları uygulanmış ve performansları karşılaştırılmıştır. Veri setinde dengesiz sınıf dağılımını dengelemek için SMOTE yöntemi kullanılmış, değişken önem analizi gerçekleştirilmiştir. Analiz sonuçlarına göre, müşteri kaybını en çok etkileyen faktör banka ürün sayısı olup, bunu müşterinin yaşı, hesap bakiyesi, coğrafi konumu, tahmini maaşı ve kredi notu takip etmiştir. Cinsiyet ve kredi kartı sahipliği gibi değişkenlerin ise müşteri kaybı üzerinde daha düşük bir etkisi olduğu tespit edilmiştir. Makine öğrenmesi modellerinin performansı doğruluk, kesinlik, duyarlılık ve F1 skoru metrikleri ile değerlendirilmiştir. En yüksek doğruluk oranı %90,43 ile CatBoost algoritması tarafından elde edilmiştir. CatBoost modelinin başarısı, kategorik değişkenleri etkili bir şekilde işlemesi ve ağaç tabanlı öğrenme süreçlerinde yüksek genelleme performansı göstermesiyle açıklanabilir. Bu çalışma, bankaların müşteri kaybını azaltmaya yönelik karar alma süreçlerinde veri odaklı modellerin önemini vurgulamakta ve müşteri bağlılığını artırmak için stratejik planlamaya katkı sağlamaktadır.
Makine öğrenmesi Müşteri kaybı analizi Sınıflandırma algoritmaları Banka
Customer churn refers to a customer’s decision to stop using the services offered by a business. In the banking sector, predicting customer churn holds significant importance for customer relationship management. In this study, an analysis was conducted using machine learning methods to predict customer churn in banks. A dataset obtained from Kaggle, which includes bank customers from France, Germany, and Spain, was utilized. Logistic Regression, K-Nearest Neighbors, Decision Tree, Random Forest, LightGBM, and CatBoost algorithms were applied and their performances compared. To address class imbalance in the dataset, the SMOTE method was employed, and feature importance analysis was performed. The results indicated that the number of bank products was the most influential factor on customer churn, followed by customer age, account balance, geographical location, estimated salary, and credit score. Variables such as gender and credit card ownership were found to have a relatively lower impact on churn. The performance of machine learning models was evaluated using accuracy, precision, recall, and F1-score metrics. The highest accuracy rate of 90.43% was achieved by the CatBoost algorithm. The success of the CatBoost model can be attributed to its effective handling of categorical variables and its strong generalization performance in tree-based learning processes. This study highlights the importance of data-driven models in supporting decision-making processes aimed at reducing customer churn in the banking sector and contributes to strategic planning for enhancing customer loyalty.
Machine learning Churn analysis Classification algorithms Bank
| Birincil Dil | Türkçe |
|---|---|
| Konular | Bankacılıkta Risk Yönetimi |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 13 Mart 2025 |
| Kabul Tarihi | 27 Ekim 2025 |
| Yayımlanma Tarihi | 29 Aralık 2025 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 24 Sayı: 54 |