Kimlik hırsızı web sitelerinin sınıflandırılması için makine öğrenmesi yöntemlerinin karşılaştırılması
Öz
Günümüzde
makine öğrenmesi yöntemleri bilgisayarların daha doğru eylemler
gerçekleştirmesi amacıyla birçok farklı şekilde kullanılmaktadır. Bu amaçla
kullanıldıkları bir alan kimlik hırsızı web sitelerinin tespit edilmesidir.
Kimlik hırsızlığı, önemli kişisel bilgileri çalmak amacıyla güvenilir web
sitelerini taklit eden sahte web sitelerinin oluşturulduğu çevrimiçi bir
saldırı biçimidir. Bu tehlikeyi gerçekleşmeden önlemek amacıyla web sitelerinin
farklı özelliklere dayanarak kimlik hırsızı bir site olup olmadığının
belirlenmesi önemlidir. Bu çalışmada, bir web sitesinin kimlik hırsızı olup
olmadığını tahmin etmek amacıyla AdaBoost, çok katmanlı algılayıcı, destek
vektör makinesi, karar ağacı, en yakın k komşu, Naïve Bayes ve rastgele orman
makine öğrenmesi yöntemleri 9 farklı özellik içeren 1353 örnekten oluşan bir
veri kümesinden yararlanarak karşılaştırılmıştır. Eğitim ve sınama şeklinde
ikiye bölünmüş veri kümesiyle yapılan deneylerde karar ağaçlarından oluşturulan
bir topluluk öğrenme yaklaşımı olan rastgele orman yöntemi, karşılaştırılan
diğer yöntemlere göre daha başarılı olsa da çapraz doğrulamanın kullanıldığı
durumda çok katmanlı algılayıcı daha yüksek bir başarım elde etmiştir.
Anahtar Kelimeler
Kaynakça
- Marshland S. Machine Learning An Algorithmic Perspective. 2nd ed. New York, USA, Chapman & Hall/CRC Press, 2015.
- Mitchell T. Machine Learning. New York, USA, McGraw Hill, 1997.
- Alpaydın E. Yapay Öğrenme. 3. Baskı. İstanbul, Türkiye, Boğaziçi Üniversitesi Yayınevi, 2017.
- Harrington P. Machine Learning in Action. New York, USA, Manning Publications, 2012.
- Abdelhamid N, Ayesh A, Thabtah F. “Phishing detection based associative classification data mining”. Expert Systems with Applications, 41(13), 5948-5959, 2014.
- Dhamija R, Tygar J D, Hearst M. “Why phishing works?”. Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, Montreal, QC, Canada, 22-27 April 2006.
- Anti-Phishing Working Group. “APWG Phishing Attack Trends Reports”. https://www.antiphishing.org/resources/apwg-reports/, (11.02.2018).
- Miyamoto D, Hazeyama H, Kadobayashi Y. “An evaluation of machine learning-based methods for detection of phishing sites”. Australian Journal of Intelligent Information Processing Systems, 10(2), 54-63, 2008.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Mühendislik
Bölüm
Araştırma Makalesi
Yazarlar
Tahir Emre Kalaycı
Bu kişi benim
0000-0001-6228-1221
Yayımlanma Tarihi
12 Ekim 2018
Gönderilme Tarihi
13 Kasım 2017
Kabul Tarihi
-
Yayımlandığı Sayı
Yıl 2018 Cilt: 24 Sayı: 5