Araştırma Makalesi

Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi

Sayı: 16 31 Ağustos 2019
PDF İndir
TR EN

Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi

Öz

Günümüzde kimlik avı yapan sahte web sitelerinin sayısı oldukça artmıştır. Bu web sitelerinin amaçları genel anlamda kişilerin, kişisel bilgilerini ele geçirerek çıkar sağlamaktır. Sosyal medya hesaplarımızdaki kimlik ve parola bilgilerimiz, alışveriş sitelerindeki kimlik ve adres bilgilerimiz bize ait kişisel bilgilerimizdir. Bu tür bilgiler istenmeyen kişilerin eline geçmesi durumunda, tahmin bile edemeyeceğimiz kötü sonuçlar doğurabilmektedir. Ayrıca online bankacılık işlemlerimiz gibi finansal işlemlerimizin önemli bir kısmını internet ortamında yapıyor olmamız bu tür sitelerden korunmamız açısından önemli bir sorun teşkil etmektedir. Bu amaçla antivürüs yazılım firmaları, tarayıcılar, arama motorları daha iyi kullanıcı hizmeti ve memnunniyet sağlamak açısından bu tür zararlı sitelerden kullanıcılarını korumak için çalışmalar yapmaktadırlar. Ayrıca sahte web sayfalarının kullanıcıların önüne gelmeden tespit edilip engellenmesi günümüz yapay zeka çalışmalarınında önemli bir çalışma alanı olmaktadır. Hergün milyarlarca insanın gezindiği internet ortamında bu sahte sitelerden korunmasının en kolay yöntemi, sahte web sayfalarının otomatik olarak tespit edilip engellenmesi olacaktır. Makine öğrenmesi sınıflandırma algoritmaları ile bir sayfaya ait bilgilere bakarak sistem tarafından otomatik olarak sahte veya gerçek olarak tespit edilmesi yapay zeka çalışmalarının sunduğu önemli avantajların başında gelmektedir. Bu çalışma ile bir web sitesi adresine ait belirlenmiş 10 özellik kullanılarak; bu adresin sahte mi, yoksa gerçek bir adres mi olduğu tespit edilmeye çalışılmaktadır. Çalışmada kullanılan veriler Machine Learning Repository (UCI)’dan alınmıştır. Verilerin analizi Çapraz Endüstri Standart Süreç Modeli(CRISP-DM) baz alınarak gerçekleştirilmiştir. Veri setinde web sitelerinin durumunu belirleyen nitelik (Class, Kimlik Avı=-1, Şüpheli=0 ve Meşru=1) olarak etiketlenmiştir. Çalışma da RStudio kullanılarak R programlama dili ile analizler yapılmıştır. Kullanılan sınıflandırma algoritmaları Rastgele Orman (RF), Destek Vektör Makineleri (SVM), J48, K-En Yakın Komşu (KNN) ve Naive Bayes algoritmalarıdır. Yapılan değerlendirmeler sonucunda Rastgele Orman algoritması ile en yüksek doğruluk performansı elde edilmiştir. 

Anahtar Kelimeler

Kaynakça

  1. Abdelhamid, N., Ayesh, A., & Thabtah, F. 2014. Phishing detection based associative classification data mining. Expert Systems with Applications, 41(13), 5948-5959.
  2. Aksu, D., Turgut, Z., Üstebay, S., Aydin, M. A. (2019). Phishing Analysis of Websites Using Classification Techniques. In International Telecommunications Conference (pp. 251-258). Springer, Singapore.
  3. Arlot, S., & Celisse, A. 2010. A survey of cross-validation procedures for model selection. Statistics surveys, 4, 40-79.
  4. Aydın, S., & Özkul, A. E. 2015. Veri Madenciliği Ve Anadolu Üniversitesi Açiköğretim Sisteminde Bir Uygulama. Journal of Research in Education and Teaching, 4(3), 36-44.
  5. Balaban, M. E.& Kartal, E. 2015.Veri Madenciliği ve Makine Öğrenmesi Temel Algoritmaları ve R Dili ile Uygulamaları. Çağlayan Kitapevi. 288s, İstanbul.
  6. Basnet, R., Mukkamala, S., Sung, A. H. 2008. “Detection of phishing attacks: A machine learning approach.” In Soft Computing Applications in Industry (pp. 373-383). Springer, Berlin, Heidelberg.
  7. Chebyshev V., Sinitsyn F., Parinov D., Kupreev O., Lopatin E., Liskin A., (2018). IT threat evolution Q3 2018. Statistics https://securelist.com/it-threat-evolution-q3-2018-statistics/88689/, Erişim Tarihi: 25.01.2019
  8. Chiew, K. L., Tan, C. L., Wong, K., Yong, K. S., & Tiong, W. K. (2019). A New Hybrid Ensemble Feature Selection Framework for Machine Learning-based Phishing Detection System. Information Sciences.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

31 Ağustos 2019

Gönderilme Tarihi

1 Temmuz 2019

Kabul Tarihi

2 Ağustos 2019

Yayımlandığı Sayı

Yıl 2019 Sayı: 16

Kaynak Göster

APA
Korkmaz, A., & Büyükgöze, S. (2019). Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi. Avrupa Bilim ve Teknoloji Dergisi, 16, 826-833. https://doi.org/10.31590/ejosat.598036
AMA
1.Korkmaz A, Büyükgöze S. Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi. EJOSAT. 2019;(16):826-833. doi:10.31590/ejosat.598036
Chicago
Korkmaz, Adem, ve Selma Büyükgöze. 2019. “Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi”. Avrupa Bilim ve Teknoloji Dergisi, sy 16: 826-33. https://doi.org/10.31590/ejosat.598036.
EndNote
Korkmaz A, Büyükgöze S (01 Ağustos 2019) Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi. Avrupa Bilim ve Teknoloji Dergisi 16 826–833.
IEEE
[1]A. Korkmaz ve S. Büyükgöze, “Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi”, EJOSAT, sy 16, ss. 826–833, Ağu. 2019, doi: 10.31590/ejosat.598036.
ISNAD
Korkmaz, Adem - Büyükgöze, Selma. “Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi”. Avrupa Bilim ve Teknoloji Dergisi. 16 (01 Ağustos 2019): 826-833. https://doi.org/10.31590/ejosat.598036.
JAMA
1.Korkmaz A, Büyükgöze S. Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi. EJOSAT. 2019;:826–833.
MLA
Korkmaz, Adem, ve Selma Büyükgöze. “Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi”. Avrupa Bilim ve Teknoloji Dergisi, sy 16, Ağustos 2019, ss. 826-33, doi:10.31590/ejosat.598036.
Vancouver
1.Adem Korkmaz, Selma Büyükgöze. Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi. EJOSAT. 01 Ağustos 2019;(16):826-33. doi:10.31590/ejosat.598036

Cited By