Research Article

Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi

Number: 16 August 31, 2019
TR EN

Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi

Abstract

Günümüzde kimlik avı yapan sahte web sitelerinin sayısı oldukça artmıştır. Bu web sitelerinin amaçları genel anlamda kişilerin, kişisel bilgilerini ele geçirerek çıkar sağlamaktır. Sosyal medya hesaplarımızdaki kimlik ve parola bilgilerimiz, alışveriş sitelerindeki kimlik ve adres bilgilerimiz bize ait kişisel bilgilerimizdir. Bu tür bilgiler istenmeyen kişilerin eline geçmesi durumunda, tahmin bile edemeyeceğimiz kötü sonuçlar doğurabilmektedir. Ayrıca online bankacılık işlemlerimiz gibi finansal işlemlerimizin önemli bir kısmını internet ortamında yapıyor olmamız bu tür sitelerden korunmamız açısından önemli bir sorun teşkil etmektedir. Bu amaçla antivürüs yazılım firmaları, tarayıcılar, arama motorları daha iyi kullanıcı hizmeti ve memnunniyet sağlamak açısından bu tür zararlı sitelerden kullanıcılarını korumak için çalışmalar yapmaktadırlar. Ayrıca sahte web sayfalarının kullanıcıların önüne gelmeden tespit edilip engellenmesi günümüz yapay zeka çalışmalarınında önemli bir çalışma alanı olmaktadır. Hergün milyarlarca insanın gezindiği internet ortamında bu sahte sitelerden korunmasının en kolay yöntemi, sahte web sayfalarının otomatik olarak tespit edilip engellenmesi olacaktır. Makine öğrenmesi sınıflandırma algoritmaları ile bir sayfaya ait bilgilere bakarak sistem tarafından otomatik olarak sahte veya gerçek olarak tespit edilmesi yapay zeka çalışmalarının sunduğu önemli avantajların başında gelmektedir. Bu çalışma ile bir web sitesi adresine ait belirlenmiş 10 özellik kullanılarak; bu adresin sahte mi, yoksa gerçek bir adres mi olduğu tespit edilmeye çalışılmaktadır. Çalışmada kullanılan veriler Machine Learning Repository (UCI)’dan alınmıştır. Verilerin analizi Çapraz Endüstri Standart Süreç Modeli(CRISP-DM) baz alınarak gerçekleştirilmiştir. Veri setinde web sitelerinin durumunu belirleyen nitelik (Class, Kimlik Avı=-1, Şüpheli=0 ve Meşru=1) olarak etiketlenmiştir. Çalışma da RStudio kullanılarak R programlama dili ile analizler yapılmıştır. Kullanılan sınıflandırma algoritmaları Rastgele Orman (RF), Destek Vektör Makineleri (SVM), J48, K-En Yakın Komşu (KNN) ve Naive Bayes algoritmalarıdır. Yapılan değerlendirmeler sonucunda Rastgele Orman algoritması ile en yüksek doğruluk performansı elde edilmiştir. 

Keywords

References

  1. Abdelhamid, N., Ayesh, A., & Thabtah, F. 2014. Phishing detection based associative classification data mining. Expert Systems with Applications, 41(13), 5948-5959.
  2. Aksu, D., Turgut, Z., Üstebay, S., Aydin, M. A. (2019). Phishing Analysis of Websites Using Classification Techniques. In International Telecommunications Conference (pp. 251-258). Springer, Singapore.
  3. Arlot, S., & Celisse, A. 2010. A survey of cross-validation procedures for model selection. Statistics surveys, 4, 40-79.
  4. Aydın, S., & Özkul, A. E. 2015. Veri Madenciliği Ve Anadolu Üniversitesi Açiköğretim Sisteminde Bir Uygulama. Journal of Research in Education and Teaching, 4(3), 36-44.
  5. Balaban, M. E.& Kartal, E. 2015.Veri Madenciliği ve Makine Öğrenmesi Temel Algoritmaları ve R Dili ile Uygulamaları. Çağlayan Kitapevi. 288s, İstanbul.
  6. Basnet, R., Mukkamala, S., Sung, A. H. 2008. “Detection of phishing attacks: A machine learning approach.” In Soft Computing Applications in Industry (pp. 373-383). Springer, Berlin, Heidelberg.
  7. Chebyshev V., Sinitsyn F., Parinov D., Kupreev O., Lopatin E., Liskin A., (2018). IT threat evolution Q3 2018. Statistics https://securelist.com/it-threat-evolution-q3-2018-statistics/88689/, Erişim Tarihi: 25.01.2019
  8. Chiew, K. L., Tan, C. L., Wong, K., Yong, K. S., & Tiong, W. K. (2019). A New Hybrid Ensemble Feature Selection Framework for Machine Learning-based Phishing Detection System. Information Sciences.

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Research Article

Publication Date

August 31, 2019

Submission Date

July 1, 2019

Acceptance Date

August 2, 2019

Published in Issue

Year 2019 Number: 16

APA
Korkmaz, A., & Büyükgöze, S. (2019). Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi. Avrupa Bilim Ve Teknoloji Dergisi, 16, 826-833. https://doi.org/10.31590/ejosat.598036
AMA
1.Korkmaz A, Büyükgöze S. Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi. EJOSAT. 2019;(16):826-833. doi:10.31590/ejosat.598036
Chicago
Korkmaz, Adem, and Selma Büyükgöze. 2019. “Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi”. Avrupa Bilim Ve Teknoloji Dergisi, nos. 16: 826-33. https://doi.org/10.31590/ejosat.598036.
EndNote
Korkmaz A, Büyükgöze S (August 1, 2019) Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi. Avrupa Bilim ve Teknoloji Dergisi 16 826–833.
IEEE
[1]A. Korkmaz and S. Büyükgöze, “Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi”, EJOSAT, no. 16, pp. 826–833, Aug. 2019, doi: 10.31590/ejosat.598036.
ISNAD
Korkmaz, Adem - Büyükgöze, Selma. “Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi”. Avrupa Bilim ve Teknoloji Dergisi. 16 (August 1, 2019): 826-833. https://doi.org/10.31590/ejosat.598036.
JAMA
1.Korkmaz A, Büyükgöze S. Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi. EJOSAT. 2019;:826–833.
MLA
Korkmaz, Adem, and Selma Büyükgöze. “Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi”. Avrupa Bilim Ve Teknoloji Dergisi, no. 16, Aug. 2019, pp. 826-33, doi:10.31590/ejosat.598036.
Vancouver
1.Adem Korkmaz, Selma Büyükgöze. Sahte Web Sitelerinin Sınıflandırma Algoritmaları İle Tespit Edilmesi. EJOSAT. 2019 Aug. 1;(16):826-33. doi:10.31590/ejosat.598036

Cited By