Xgboost ve Shap Kullanılarak Açıklanabilir Kimlik Avı Tespiti: Web Sitesi İçeriği ve URL Yapısı Veri Setleri Üzerine Karşılaştırmalı Bir Çalışma
Öz
Kimlik avı (phishing), sağlam ve güvenilir tespit yöntemleri gerektiren önemli bir siber güvenlik tehdidi olmaya devam etmektedir. Bu çalışma, şu araştırma sorusunu yanıtlamayı hedefler: Web sitesi içeriği ve URL yapısına dayalı özellikler, XGBoost tabanlı kimlik avı tespit modellerinin kararlarını nasıl etkiler ve SHAP bu kararların açıklanabilirliğini nasıl artırır? Makine öğrenmesi (MÖ) modelleri, özellikle XGBoost gibi gradyan artırma algoritmaları yüksek doğruluk gösterse de, kara kutu yapıları, kritik güvenlik uygulamalarında güveni ve dağıtımı sıklıkla engellemektedir. Açıklanabilir Yapay Zeka (AYZ) teknikleri, örneğin Shapley Additive exPlanations (SHAP), model tahminlerine ilişkin içgörüler sağlayarak bir çözüm sunar. Bu çalışma, UCI Makine Öğrenmesi Deposundan iki kimlik avı veri seti üzerinde XGBoost sınıflandırıcılarını eğitip değerlendirmiştir. Phishing Websites (ID=327) veri seti web sitesi içeriği ve yapısal özelliklere, PhiUSIIL Phishing URL (ID=967) veri seti ise URL sözcüksel ve ana bilgisayar tabanlı özelliklere odaklanmıştır. Her iki model de sırasıyla 0.9967 ve 1.0000 AUC skorları ile yüksek performansı elde etmiştir; ancak PhiUSIIL’deki mükemmel skor, potansiyel aşırı uyum riskini gündeme getirir. Ardından, her model için hem küresel hem de yerel açıklamalar üretmek üzere SHAP uygulanmıştır. Karşılaştırmalı analiz, belirgin özellik önemi örüntülerini ortaya koymaktadır: web sitesi verisiyle eğitilen model, büyük ölçüde url_of_anchor ve sslfinal_state özelliklerine dayanırken, URL tabanlı model, ezici bir şekilde URLSimilarityIndex tarafından baskındır. Yerel açıklamalar, yanlış sınıflandırmalar da dahil olmak üzere, bireysel tahminleri daha ayrıntılı bir şekilde inceleyerek model kararlarını yönlendiren belirli özellik katkılarını vurgulamaktadır. Bu karşılaştırmalı AYZ yaklaşımı, yalnızca model performansını doğrulamakla kalmaz, aynı zamanda temel alınan karar mekanizmalarını ortaya çıkararak şeffaflığı artırır ve kimlik avı tespit sistemlerini iyileştirmek için eyleme geçirilebilir içgörüler sağlar.
Anahtar Kelimeler
Kaynakça
- Adadi, A., & Berrada, M. (2018). Peeking inside the black-box: A survey on explainable artificial intelligence (XAI). IEEE Access, 6, 52138–52160.
- Alenezi, R., & Ludwig, S. A. (2021). Explainability of cybersecurity threats data using SHAP. In 2021 IEEE Symposium Series on Computational Intelligence (SSCI) (pp. 1–10). IEEE.
- Alzboon, M. S., Al-Batah, M. S., Alqaraleh, M., & Alzboon, F. (2024). Phishing website detection using machine learning. Journal of Electrical Engineering, Electronics, Control and Computer Science, 10(1), 45–52.
- APWG. (2024). Phishing activity trends report, 4Q 2024.
- Arrieta, A. B., Díaz-Rodríguez, N., Del Ser, J., Bennetot, A., Tabik, S., Barbado, A., Fernández, A., Herrera, F., et al. (2020). Explainable artificial intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI. Information Fusion, 58, 82–115.
- Basnet, R., Mukkamala, S., & Sung, A. H. (2008). Detection of phishing attacks: A machine learning approach. In A. Abraham, A.-E. Hassanien, & V. Snášel (Eds.), Soft computing applications in industry (pp. 373–383). Springer.
- Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp. 785–794). Association for Computing Machinery.
- Das, A., & Rad, P. (2020). Opportunities and challenges in explainable artificial intelligence (XAI): A survey (arXiv:2006.11371). arXiv. https://arxiv.org/abs/2006.11371
Ayrıntılar
Birincil Dil
Türkçe
Konular
Siber Güvenlik ve Gizlilik (Diğer), Yapay Zeka (Diğer)
Bölüm
Araştırma Makalesi
Yazarlar
Rıdvan Avcı
0009-0000-7524-2061
Türkiye
Yasemin Zeynep Avcı
Bu kişi benim
0000-0003-1297-6708
Türkiye
Yayımlanma Tarihi
5 Haziran 2026
Gönderilme Tarihi
20 Aralık 2025
Kabul Tarihi
2 Haziran 2026
Yayımlandığı Sayı
Yıl 2026 Cilt: 2 Sayı: 1