Bu çalışma, aşırı sınıf dengesizliği koşulları altında işlem düzeyinde kara para aklama tespitine yönelik denetimli makine öğrenmesi yöntemlerinin karşılaştırmalı bir değerlendirmesini sunmaktadır. Deneyler, yaklaşık yedi milyon işlemden oluşan ve kara para aklama oranı yaklaşık %0,05 olan IBM Transactions for Anti-Money Laundering veri setinin Lower Illicit–Small alt kümesi üzerinde gerçekleştirilmiştir. Lojistik Regresyon, Rastgele Orman, XGBoost ve CatBoost modelleri, modele özgü ön işleme adımları ve hiperparametre ayarlamaları kullanılarak uygulanmıştır. Model performansı, bağımsız bir test kümesi üzerinde doğruluk, kesinlik, duyarlılık, F1-skoru, ROC-AUC ve dengeli doğruluk ölçütleri kullanılarak değerlendirilmiştir. Bulgular, modeller arasında belirgin kesinlik–duyarlılık dengeleri bulunduğunu göstermektedir. Lojistik Regresyon en yüksek duyarlılık ve dengeli doğruluk değerleriyle kapsayıcı bir tespit yaklaşımını yansıtırken, CatBoost daha yüksek kesinlik ve ROC-AUC Alan performansı ile daha muhafazakâr alarm stratejilerini desteklemektedir. Sonuçlar, uygulamalı kara para aklama tarama sistemlerinde ölçüt temelli model seçiminin ve uygun karar eşiklerinin belirlenmesinin önemini ortaya koymaktadır.
Kara Para Aklama Finansal Dolandırıcılık Tespiti Makine Öğrenmesi Sınıf Dengesizliği İşlem Sınıflandırması
This study presents a comparative evaluation of supervised machine learning methods for transaction-level anti-money laundering detection under extreme class imbalance. Experiments are conducted on the Lower Illicit–Small subset of the IBM Transactions for anti-money laundering dataset, which includes nearly seven million transactions with a laundering prevalence of approximately 0.05%. Logistic Regression, Random Forest, XGBoost, and CatBoost models are implemented using model-specific preprocessing and hyperparameter tuning strategies. Model performance is assessed on an independent test set using accuracy, precision, recall, F1-score, ROC-AUC, and balanced accuracy metrics. The results reveal clear precision–recall trade-offs among the models. Logistic Regression achieves the highest recall and balanced accuracy, indicating a coverage-oriented detection strategy, whereas CatBoost demonstrates superior precision and ROC-AUC, supporting more conservative alerting approaches. Overall, the findings highlight the importance of metric-driven model selection and careful operating-point design in practical anti-money laundering screening systems.
Anti-Money Laundering Financial Fraud Detection Machine Learning Class Imbalance Transaction Classification
| Birincil Dil | İngilizce |
|---|---|
| Konular | Makine Öğrenme (Diğer) |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 24 Aralık 2025 |
| Kabul Tarihi | 5 Mart 2026 |
| Yayımlanma Tarihi | 30 Nisan 2026 |
| DOI | https://doi.org/10.46387/bjesr.1848543 |
| IZ | https://izlik.org/JA95DL62XC |
| Yayımlandığı Sayı | Yıl 2026 Cilt: 8 Sayı: 1 |