Research Article
BibTex RIS Cite

Banka kredisi tahmini için makine öğrenmesi algoritmalarının performans analizi: Topluluk öğrenmesi algoritmalarının üstünlüğü

Year 2024, Volume: 7 Issue: 1, 1 - 20
https://doi.org/10.55198/artibilimfen.1400881

Abstract

Banka kredisi tahmini, finansal risklerin öngörülmesi ve kredi başvurularının etkin bir şekilde değerlendirilmesi bakımından büyük bir öneme sahiptir. Bu amaçla yapılan araştırmada, çeşitli makine öğrenmesi algoritmaları banka kredisi tahmini problemine yönelik performanslarını değerlendirmek amacıyla incelenmiştir. Bu deneylerde genellikle, algoritmaların tahmin doğruluğu, hassasiyeti, hata oranları gibi performans metrikleri üzerinden ölçülmüştür. Farklı algoritmaların, veri setlerinin büyüklüğü, veri özellikleri ve sınıflandırma performansı gibi faktörler açısından karşılaştırılmıştır. Bu karşılaştırmaların temel amacı, belirli bir veri seti veya problem bağlamında hangi algoritmanın daha iyi performans sergilediğini anlamaktır. Bu çalışmalar, banka kredisi tahmini gibi finansal uygulamalarda daha etkili ve doğru kararlar alınmasına katkıda bulunmuş ve uzman kişilere karar almada yardımcı olur. Algoritmaların avantajları ve dezavantajları, genelleştirilebilirlikleri ve hesaplama karmaşıklıkları gibi faktörler de bu deneylerde dikkate alınmıştır. Sonuç olarak, bu karşılaştırmalı deneyler, finansal alanlarda makine öğrenmesi algoritmalarının performanslarını değerlendirmek için önemli bir rol oynamıştır. Bu çalışmanın sonuçları, Topluluk Öğrenmesi altında bulunan algoritmaların diğerlerine kıyasla banka kredisi tahmini gibi kritik finansal konularda daha başarılı olduğunu ortaya koymuştur.

References

  • Baesens, B., Van Gestel, B.T., Viaene, S., Stepanova, M., Suykens, J., Vanthienen, J. (2003). Benchmarking State-of-the-art classification algorithms for credit scoring. Journal of the Operational Research Society, 54, 627-635.
  • Crone, S. F., Finlay, S. (2012). Instance sampling in credit scoring: an empirical study of sample size and balancing. International Journal of Forecasting, Elsevier, 28 (1), 224-238.
  • Serengil, S.I., Imece, S., Tosun, U.G., Buyukbas, E.B., Koroglu, B. (2022). A comparative study of machine learning approaches for non performing loan prediction with explainability. International Journal of Machine Learning and Computing, 12 (5), 208-214.
  • Provenzano, A.R., Trifirò, D., Datteo, A., Giada, L., Jean, N., Riciputi, A., Pera, G.L., Spadaccino, M., Massaron, L., Nordio, C. (2020). Machine learning approach for credit scoring. arXiv: Statistical Finance.
  • Altan, G., Demirci, S. (2022). Makine öğrenmesi ile nakit akış tablosu üzerinden kredi skorlaması: Xgboost yaklaşımı. Journal of Economic Policy Researches, 9 (2), 397-424.
  • Alan, A., Karabatak, M. (2020). Veri seti - sınıflandırma ilişkisinde performansa etki eden faktörlerin değerlendirilmesi. Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 32 (2), 531-540.
  • Xia, Y., Liu, C., Liu, N. (2017). Cost-sensitive boosted tree for loan evaluation in peer-to-peer lending. Electronic Commerce Research Applications 24, 30-49.
  • Nisbet, R., Miner, G., Yale, K. (2018). Handbook of statistical analysis and data mining applications. Second edition. Academic Press – Elsevier, London.
  • Gür, Ö., Tarhan Mengi, B. (2022). Hile tespitinde makine öğrenmesi yöntemlerinin kullanılması ve model performanslarının değerlendirilmesi. İşletme Araştırmaları Dergisi, 14 (4), 3053-3065.
  • Moscato, V., Picariello, A., Sperlí, G. (2021). A benchmark of machine learning approaches for credit score prediction. Expert Systems with Application, 165, 113986.
  • Meyer, P.A., Pifer, H.W. (1970). Prediction of bank failures. Journal of Finance, 25(4), 853-868.
  • Li, Y., Chen, W. (2020). A comparative performance assessment of ensemble learning for credit scoring. Mathematics, 8 (10), 1756.
  • Sönmez, F. (2015). Kredi skorunun belirlenmesinde yapay sinir ağları ve karar ağaçlarının kullanımı bir model önerisi. Anadolu Bil Meslek Yüksekokulu Dergisi, 37, 1-22.
  • Bahnsen, A.C., Aouada, D., Ottersten, B. (2014). Example-dependent cost-sensitive logistic regression for credit scoring. 13th International Conference on Machine Learning and Applications, Detroit, MI, USA, 263-269.
  • Kim, J., Choi, K., Kim, G., Suh, Y. (2012). Classification cost: An empirical comparison among traditional classifier, cost-sensitive classifier, and metacost. Expert Systems with Application, 39 (4), 4013-4019.
  • Bhatıa, P. (2019). Data mining and data warehousing principles and practical techniques, First Published. Cambridge University Press, United Kingdom.
  • Bank Loan Status Dataset - Future Loan Status Prediction via Classification Models. (2018). https://www.kaggle.com/datasets/zaurbegiev/my-dataset (11.11.2023).
  • Larose, D. T. (2005). Discovering knowledge in data: An introduction to data mining. John Wiley & Sons, New Jersey.
  • Akpınar, H. (2017). Veri madenciliği veri analizi. 2. Baskı. Papatya Yayıncılık Eğitim, İstanbul.
  • Han, J.W., Kamber, M., Pei, J. (2012). Data mining concepts and techniques. Third Edition, Morgan Kaufmann, Waltham.
  • Kingsford, C., Salzberg, S. L. (2008). What are decision trees?. Nature Biotechnology, 26 (9), 1011-1013.
  • Noble, W. S. (2006). What is a support vector machine?. Nature Biotechnology, 24 (12), 1565- 1567.
  • Bustamante, C., Garrido, L., Soto, R. (2006). Comparing fuzzy naive bayes and gaussian naive bayes for decision making in robocup 3d. In Mexican International Conference on Artificial Intelligence (pp. 237-247). Berlin, Heidelberg: Springer Berlin Heidelberg.
  • Peterson, L. E. (2009). K-nearest neighbor. Scholarpedia, 4 (2), 1883.
  • Zou, J., Han, Y., So, S. S. (2009). Overview of artificial neural networks. Artificial neural networks: methods and applications, 14-22.
  • Qi, Y. (2012). Random forest for bioinformatics. Ensemble machine learning: Methods and applications, 307-323.
  • LaValley, M. P. (2008). Logistic regression. Circulation, 117 (18), 2395-2399.
  • Bottou, L. (2012). Stochastic gradient descent tricks. In Neural Networks: Tricks of the Trade: Second Edition (pp. 421-436). Berlin, Heidelberg: Springer Berlin Heidelberg.
  • Tharwat, A. (2016). Linear vs. quadratic discriminant analysis classifier: a tutorial. International Journal of Applied Pattern Recognition, 3 (2), 145-180.
  • Margineantu, D. D., Dietterich, T. G. (1997). Pruning adaptive boosting. In ICML, Vol. 97, pp. 211-218.
  • Natekin, A., Knoll, A. (2013). Gradient boosting machines, a tutorial. Frontiers in neurorobotics, 7, 21.
  • Chen, T., He, T., Benesty, M., Khotilovich, V., Tang, Y., Cho, H., Zhou, T. (2015). Xgboost: extreme gradient boosting. R package version 0.4-2, 1(4), 1-4.
  • Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., Liu, T. Y. (2017). Lightgbm: A highly efficient gradient boosting decision tree. Advances in Neural Information Processing Systems, 30.
  • Prokhorenkova, L., Gusev, G., Vorobev, A., Dorogush, A. V., Gulin, A. (2018). CatBoost: unbiased boosting with categorical features. Advances in Neural Information Processing Systems, 31.
  • Singh, P. K., Pramanik, P. K. D., Debnath, N. C., Choudhury, P. (2019). A novel neighborhood calculation method by assessing users' varying preferences in collaborative filtering. In CATA (pp. 345-355).
  • Japkowicz N. (2011). Performance evaluation for learning algorithms. Cambridge University Press, Cambridge.
  • Beaver, W.H. (1966). Financial ratios as predictors of failure. Journal of Accounting Research, 4, 71-111.
  • Altman, E. I. (1968). Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. Journal of Finance, 23 (4), 589-609.
  • Ampountolas, A., Nde, T. N., Date, P. Constantinescu, C. (2021). A machine learning approach for micro-credit scoring. Risks, MDPI AG, 9 (3), 50:1-20.
Year 2024, Volume: 7 Issue: 1, 1 - 20
https://doi.org/10.55198/artibilimfen.1400881

Abstract

References

  • Baesens, B., Van Gestel, B.T., Viaene, S., Stepanova, M., Suykens, J., Vanthienen, J. (2003). Benchmarking State-of-the-art classification algorithms for credit scoring. Journal of the Operational Research Society, 54, 627-635.
  • Crone, S. F., Finlay, S. (2012). Instance sampling in credit scoring: an empirical study of sample size and balancing. International Journal of Forecasting, Elsevier, 28 (1), 224-238.
  • Serengil, S.I., Imece, S., Tosun, U.G., Buyukbas, E.B., Koroglu, B. (2022). A comparative study of machine learning approaches for non performing loan prediction with explainability. International Journal of Machine Learning and Computing, 12 (5), 208-214.
  • Provenzano, A.R., Trifirò, D., Datteo, A., Giada, L., Jean, N., Riciputi, A., Pera, G.L., Spadaccino, M., Massaron, L., Nordio, C. (2020). Machine learning approach for credit scoring. arXiv: Statistical Finance.
  • Altan, G., Demirci, S. (2022). Makine öğrenmesi ile nakit akış tablosu üzerinden kredi skorlaması: Xgboost yaklaşımı. Journal of Economic Policy Researches, 9 (2), 397-424.
  • Alan, A., Karabatak, M. (2020). Veri seti - sınıflandırma ilişkisinde performansa etki eden faktörlerin değerlendirilmesi. Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 32 (2), 531-540.
  • Xia, Y., Liu, C., Liu, N. (2017). Cost-sensitive boosted tree for loan evaluation in peer-to-peer lending. Electronic Commerce Research Applications 24, 30-49.
  • Nisbet, R., Miner, G., Yale, K. (2018). Handbook of statistical analysis and data mining applications. Second edition. Academic Press – Elsevier, London.
  • Gür, Ö., Tarhan Mengi, B. (2022). Hile tespitinde makine öğrenmesi yöntemlerinin kullanılması ve model performanslarının değerlendirilmesi. İşletme Araştırmaları Dergisi, 14 (4), 3053-3065.
  • Moscato, V., Picariello, A., Sperlí, G. (2021). A benchmark of machine learning approaches for credit score prediction. Expert Systems with Application, 165, 113986.
  • Meyer, P.A., Pifer, H.W. (1970). Prediction of bank failures. Journal of Finance, 25(4), 853-868.
  • Li, Y., Chen, W. (2020). A comparative performance assessment of ensemble learning for credit scoring. Mathematics, 8 (10), 1756.
  • Sönmez, F. (2015). Kredi skorunun belirlenmesinde yapay sinir ağları ve karar ağaçlarının kullanımı bir model önerisi. Anadolu Bil Meslek Yüksekokulu Dergisi, 37, 1-22.
  • Bahnsen, A.C., Aouada, D., Ottersten, B. (2014). Example-dependent cost-sensitive logistic regression for credit scoring. 13th International Conference on Machine Learning and Applications, Detroit, MI, USA, 263-269.
  • Kim, J., Choi, K., Kim, G., Suh, Y. (2012). Classification cost: An empirical comparison among traditional classifier, cost-sensitive classifier, and metacost. Expert Systems with Application, 39 (4), 4013-4019.
  • Bhatıa, P. (2019). Data mining and data warehousing principles and practical techniques, First Published. Cambridge University Press, United Kingdom.
  • Bank Loan Status Dataset - Future Loan Status Prediction via Classification Models. (2018). https://www.kaggle.com/datasets/zaurbegiev/my-dataset (11.11.2023).
  • Larose, D. T. (2005). Discovering knowledge in data: An introduction to data mining. John Wiley & Sons, New Jersey.
  • Akpınar, H. (2017). Veri madenciliği veri analizi. 2. Baskı. Papatya Yayıncılık Eğitim, İstanbul.
  • Han, J.W., Kamber, M., Pei, J. (2012). Data mining concepts and techniques. Third Edition, Morgan Kaufmann, Waltham.
  • Kingsford, C., Salzberg, S. L. (2008). What are decision trees?. Nature Biotechnology, 26 (9), 1011-1013.
  • Noble, W. S. (2006). What is a support vector machine?. Nature Biotechnology, 24 (12), 1565- 1567.
  • Bustamante, C., Garrido, L., Soto, R. (2006). Comparing fuzzy naive bayes and gaussian naive bayes for decision making in robocup 3d. In Mexican International Conference on Artificial Intelligence (pp. 237-247). Berlin, Heidelberg: Springer Berlin Heidelberg.
  • Peterson, L. E. (2009). K-nearest neighbor. Scholarpedia, 4 (2), 1883.
  • Zou, J., Han, Y., So, S. S. (2009). Overview of artificial neural networks. Artificial neural networks: methods and applications, 14-22.
  • Qi, Y. (2012). Random forest for bioinformatics. Ensemble machine learning: Methods and applications, 307-323.
  • LaValley, M. P. (2008). Logistic regression. Circulation, 117 (18), 2395-2399.
  • Bottou, L. (2012). Stochastic gradient descent tricks. In Neural Networks: Tricks of the Trade: Second Edition (pp. 421-436). Berlin, Heidelberg: Springer Berlin Heidelberg.
  • Tharwat, A. (2016). Linear vs. quadratic discriminant analysis classifier: a tutorial. International Journal of Applied Pattern Recognition, 3 (2), 145-180.
  • Margineantu, D. D., Dietterich, T. G. (1997). Pruning adaptive boosting. In ICML, Vol. 97, pp. 211-218.
  • Natekin, A., Knoll, A. (2013). Gradient boosting machines, a tutorial. Frontiers in neurorobotics, 7, 21.
  • Chen, T., He, T., Benesty, M., Khotilovich, V., Tang, Y., Cho, H., Zhou, T. (2015). Xgboost: extreme gradient boosting. R package version 0.4-2, 1(4), 1-4.
  • Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., Liu, T. Y. (2017). Lightgbm: A highly efficient gradient boosting decision tree. Advances in Neural Information Processing Systems, 30.
  • Prokhorenkova, L., Gusev, G., Vorobev, A., Dorogush, A. V., Gulin, A. (2018). CatBoost: unbiased boosting with categorical features. Advances in Neural Information Processing Systems, 31.
  • Singh, P. K., Pramanik, P. K. D., Debnath, N. C., Choudhury, P. (2019). A novel neighborhood calculation method by assessing users' varying preferences in collaborative filtering. In CATA (pp. 345-355).
  • Japkowicz N. (2011). Performance evaluation for learning algorithms. Cambridge University Press, Cambridge.
  • Beaver, W.H. (1966). Financial ratios as predictors of failure. Journal of Accounting Research, 4, 71-111.
  • Altman, E. I. (1968). Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. Journal of Finance, 23 (4), 589-609.
  • Ampountolas, A., Nde, T. N., Date, P. Constantinescu, C. (2021). A machine learning approach for micro-credit scoring. Risks, MDPI AG, 9 (3), 50:1-20.
There are 39 citations in total.

Details

Primary Language Turkish
Subjects Theoretical and Computational Chemistry (Other)
Journal Section Research Articles
Authors

Enes Çelik 0000-0002-3282-865X

Önder Gür 0000-0003-3249-4300

Early Pub Date June 30, 2024
Publication Date
Submission Date December 5, 2023
Acceptance Date April 2, 2024
Published in Issue Year 2024 Volume: 7 Issue: 1

Cite

APA Çelik, E., & Gür, Ö. (2024). Banka kredisi tahmini için makine öğrenmesi algoritmalarının performans analizi: Topluluk öğrenmesi algoritmalarının üstünlüğü. Artıbilim: Adana Alparslan Türkeş Bilim Ve Teknoloji Üniversitesi Fen Bilimleri Dergisi, 7(1), 1-20. https://doi.org/10.55198/artibilimfen.1400881
AMA Çelik E, Gür Ö. Banka kredisi tahmini için makine öğrenmesi algoritmalarının performans analizi: Topluluk öğrenmesi algoritmalarının üstünlüğü. Artıbilim: Adana Alparslan Türkeş Bilim ve Teknoloji Üniversitesi Fen Bilimleri Dergisi. June 2024;7(1):1-20. doi:10.55198/artibilimfen.1400881
Chicago Çelik, Enes, and Önder Gür. “Banka Kredisi Tahmini için Makine öğrenmesi algoritmalarının Performans Analizi: Topluluk öğrenmesi algoritmalarının üstünlüğü”. Artıbilim: Adana Alparslan Türkeş Bilim Ve Teknoloji Üniversitesi Fen Bilimleri Dergisi 7, no. 1 (June 2024): 1-20. https://doi.org/10.55198/artibilimfen.1400881.
EndNote Çelik E, Gür Ö (June 1, 2024) Banka kredisi tahmini için makine öğrenmesi algoritmalarının performans analizi: Topluluk öğrenmesi algoritmalarının üstünlüğü. Artıbilim: Adana Alparslan Türkeş Bilim ve Teknoloji Üniversitesi Fen Bilimleri Dergisi 7 1 1–20.
IEEE E. Çelik and Ö. Gür, “Banka kredisi tahmini için makine öğrenmesi algoritmalarının performans analizi: Topluluk öğrenmesi algoritmalarının üstünlüğü”, Artıbilim: Adana Alparslan Türkeş Bilim ve Teknoloji Üniversitesi Fen Bilimleri Dergisi, vol. 7, no. 1, pp. 1–20, 2024, doi: 10.55198/artibilimfen.1400881.
ISNAD Çelik, Enes - Gür, Önder. “Banka Kredisi Tahmini için Makine öğrenmesi algoritmalarının Performans Analizi: Topluluk öğrenmesi algoritmalarının üstünlüğü”. Artıbilim: Adana Alparslan Türkeş Bilim ve Teknoloji Üniversitesi Fen Bilimleri Dergisi 7/1 (June 2024), 1-20. https://doi.org/10.55198/artibilimfen.1400881.
JAMA Çelik E, Gür Ö. Banka kredisi tahmini için makine öğrenmesi algoritmalarının performans analizi: Topluluk öğrenmesi algoritmalarının üstünlüğü. Artıbilim: Adana Alparslan Türkeş Bilim ve Teknoloji Üniversitesi Fen Bilimleri Dergisi. 2024;7:1–20.
MLA Çelik, Enes and Önder Gür. “Banka Kredisi Tahmini için Makine öğrenmesi algoritmalarının Performans Analizi: Topluluk öğrenmesi algoritmalarının üstünlüğü”. Artıbilim: Adana Alparslan Türkeş Bilim Ve Teknoloji Üniversitesi Fen Bilimleri Dergisi, vol. 7, no. 1, 2024, pp. 1-20, doi:10.55198/artibilimfen.1400881.
Vancouver Çelik E, Gür Ö. Banka kredisi tahmini için makine öğrenmesi algoritmalarının performans analizi: Topluluk öğrenmesi algoritmalarının üstünlüğü. Artıbilim: Adana Alparslan Türkeş Bilim ve Teknoloji Üniversitesi Fen Bilimleri Dergisi. 2024;7(1):1-20.