Research Article

İnternet Sayfası Verileri Kullanarak Kimlik Avı Web Sitelerinin Makine Öğrenme Tekniğiyle Tespiti

Number: 31 December 31, 2021
TR EN

İnternet Sayfası Verileri Kullanarak Kimlik Avı Web Sitelerinin Makine Öğrenme Tekniğiyle Tespiti

Öz

Saldırganlar kurbanlarının kredi kartı, e-posta, sosyal medya hesap bilgileri gibi hassas verileri ele geçirmek için sahte web siteleri tasarlamaktadırlar. Bu saldırılar son zamanlarda daha karmaşık hale gelmiş dikkatli kullanıcıları kolayca kandırabilen oldukça ikna edici tasarımlar geliştirmişlerdir. Giderek daha tehlikeli hale gelen bu soruna çözüm bulmak için yapılan çalışmalar sahte web sayfalarının verileri ile kimlik avı amacı ile hazırlanmış web sayfalarının makine öğrenmesi yöntemi kullanarak tahminini yapabilecek sistemler tasarlanmıştır. Bu çalışmada seçilen örnek web sitesi adresine ait belirlenmiş 6 özellik kullanılarak; bu web site adreslerinin kimlik avı amacı ile hazırlanıp hazırlanmadığı rastgele orman (random forest) algoritması kullanarak tespit edilmeye çalışılmaktadır. Çalışmada seçilen veri seti, Uluslararası Siber Olaylara Müdahale Merkezinin resmi web sitesinde yer alan açık kaynak verileri kullanılmıştır. Toplamda 12.275 adet web sitesi çalışma için değerlendirilmiştir. Veri seti, internet URL ve alan adlarının belirlenen 6 özelliğin kategorilendirilmesi ve etiketlenmesi ile oluşturulmuştur. Etiketler (Kimlik avı=1, Şüpheli=0, Meşru=-1) python dilinde geliştirilmiş betikler ve tablolama programlarından yararlanılarak belirlenmiştir. Çalışma sonucunda kullanılan yöntem 95% başarı performansı göstermiştir.

Anahtar Kelimeler

References

  1. CNN | Phishing scams reel in your identity, CNN. [Çevrimiçi]. https://edition.cnn.com/2003/TECH/internet/07/21/phishing.scam/index.html [Erişim: 27-Eylül-2021].
  2. Keepnetlabs | 2020 phishing statistics, Keepnetlabs. [Çevrimiçi]. https://www.keepnetlabs.com/phishing-statistics-you-need-to-know-to-protect-your-organization/#easy-footnote-bottom-3-3791 [Erişim: 19-Eylül-2021].
  3. Verizon | 2020 Summary of Findings, Verizon. [Çevrimiçi]. https://enterprise.verizon.com/resources/reports/dbir/2020/summary-of-findings/ [Erişim: 6-Ekim-2021].
  4. Bhardwaj, A., Sapra, V., Kumar, A., Kumar, N., & Arthi, S. (2020). Why is phishing still successful?. Computer Fraud & Security, 2020(9), 15-19.
  5. Ometov, A., Bezzateev, S., Mäkitalo, N., Andreev, S., Mikkonen, T., & Koucheryavy, Y. (2018). Multi-factor authentication: A survey. Cryptography, 2(1), 1.
  6. Apandi, Siti & Sallim, Jamaludin & Sidek, Roslina. (2020). Types of anti-phishing solutions for phishing attack. IOP Conference Series: Materials Science and Engineering. 769. 012072. 10.1088/1757-899X/769/1/012072. M. Young, The Technical Writer’s Handbook. Mill Valley, CA: University Science, 1989.
  7. Al-Ahmadi, S. (2020). A Deep Learning Technique for Web Phishing Detection Combined URL Features and Visual Similarity. International Journal of Computer Networks & Communications (IJCNC) Vol, 12.
  8. Awasthi, A., & Goel, N. (2021). Phishing Website Prediction: A Machine Learning Approach. In Progress in Advanced Computing and Intelligent Engineering (pp. 143-152). Springer, Singapore.

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Research Article

Publication Date

December 31, 2021

Submission Date

October 11, 2021

Acceptance Date

December 6, 2021

Published in Issue

Year 2021 Number: 31

APA
Ok, M., & Kara, İ. (2021). İnternet Sayfası Verileri Kullanarak Kimlik Avı Web Sitelerinin Makine Öğrenme Tekniğiyle Tespiti. Avrupa Bilim Ve Teknoloji Dergisi, 31, 182-187. https://doi.org/10.31590/ejosat.1008335