TR
EN
Topluluk sınıflandırıcı kullanarak zararlı url tespiti
Öz
Teknolojinin gelişmesi ve internet kullanıcı sayısındaki artışla orantılı olarak siber suçlarda da artış gözlemlenmiştir. Birçok farklı siber saldırı tekniği bulunmaktadır. Bu saldırı tekniklerinden biri olan kötü amaçlı web siteleri, siber saldırılar ve dolandırıcılık olaylarında önemli rol oynamaktadır. İnternette masum görünen bir bağlantıya tıklamak veya e-posta ve mesaj yoluyla gönderilen bir web sayfasını ziyaret etmek arka planda sistemimizde kimlik avı kampanyalarının başlatılmasına, kötü amaçlı yazılımların, casus yazılımların, fidye yazılımların indirilmesine ve ciddi parasal kayıplar oluşmasına yol açar. Dolayısıyla bu tehditlerin etkin bir şekilde tespit edilmesi ve önlenmesi bireyler, kurumlar ve hükümetler için oldukça önemli bir konu haline gelmiştir. Kara listeye dayalı yöntemler, kötü amaçlı URL'leri tanımlamak için kullanılan standart yöntemlerden biridir. Ancak kara listeler hiçbir zaman kapsamlı değildir ve yeni oluşturulan URL'leri algılama yeteneğinden yoksundur. Kara listeye dayalı yöntemlerin mevcut ihtiyacı ve eksiklikleri de göz önünde bulundurularak bu çalışmada toplulukla öğrenme yöntemleri kullanılarak bir sınıflandırma yaklaşımı önerilmiştir. Çalışmada iyi huylu ve kötü huylu URL’lerden elde edilmiş 79 sözcüksel özellik içeren Kanada Siber Güvenlik Enstitüsü'nün URL veriseti (ISCX-URL-2016) üzerinde çalışılmıştır. Verisetinde benign, spam, phishing, malware ve defacement olmak üzere beş farklı URL türü bulunmaktadır. Toplam 7781 iyi huylu ve 28.917 tane zararlı URL kaydı üzerinde zararlı, zararsız etiketleri kullanılarak ikili sınıflandırma işlemi ve beş farklı etiket bilgisi kullanılarak çoklu sınıflandırma işlemi gerçekleştirilmiştir. Makine öğrenmesi yöntemlerinden Rastgele Orman algoritması uygulanan yöntemin başarısının sınanması için 10-katlamalı çapraz doğrulama (10-fold cross validation) ile birlikte kullanılmıştır ve 10 temel bileşen kullanılarak ikili sınıflandırma problemi için ortalama %99.42, çoklu sınıflandırma problemi için ortalama %95.68 doğruluk değeri elde edilmiştir. Böylece sisteme her gün yenilerinin katıldığı, dinamik ortamdaki kötü niyetli tasarlanmış web sitelerinden korunmaya yönelik yüksek başarım oranına sahip bir model önerisi sunulmuştur.
Anahtar Kelimeler
Kaynakça
- R. A. Dwan Jr., A. M. Tavares, “Predictive Analysis: Machine Learning Models for URL Classification”, Faculty of Worcester Polytechnic Institute, 2019.
- D. K. McGrath and M. Gupta, "Behind phishing: An examination of phisher modi operandi", Proc. LEET, pp. 4, April 2008.
- J. Ma, L. K. Saul, S. Savage and G. M. Voelker, "Identifying suspicious URLs: An application of large-scale online learning", Proc. Int. Conf. Mach. Learn., 681-688, 2009.
- K. Thomas, C. Grier, J. Ma, V. Paxson and D. Song, "Design and Evaluation of a Real-Time URL Spam Filtering Service," 2011 IEEE Symposium on Security and Privacy, 447-462, 2011.
- H Choi, B B Zhu and H. Lee, "Detecting malicious web links and identifying their attack types[C]", Usenix Conference on Web Application Development, 11-11, 2011.
- M. Lin, C. Chiu, Y. Lee and H. Pao, "Malicious URL filtering—A big data application", Proc. IEEE Int. Conf. Big Data, 589-596, 2013.
- W. Chu, B. B. Zhu, F. Xue, X. Guan and Z. Cai, "Protect sensitive sites from phishing attacks using features extractable from inaccessible phishing urls", 2013 IEEE International Conference on Communications (ICC)., 2013, 1990-1994.
- M. S. I. Mamun, M. A. Rathore, A. H. Lashkari, N. Stakhanova and A. A. Ghorbani, "Detecting malicious URLs using lexical analysis", Proc. Int. Conf. Netw. Syst. Secur, 467-482, 2016.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Mühendislik
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
30 Aralık 2021
Gönderilme Tarihi
6 Temmuz 2021
Kabul Tarihi
7 Ağustos 2021
Yayımlandığı Sayı
Yıl 2021 Cilt: 4 Sayı: 3
APA
Köksal, K., Doğan, B., & Altıkardeş, Z. A. (2021). Topluluk sınıflandırıcı kullanarak zararlı url tespiti. Veri Bilimi, 4(3), 113-122. https://izlik.org/JA37UZ84AL
AMA
1.Köksal K, Doğan B, Altıkardeş ZA. Topluluk sınıflandırıcı kullanarak zararlı url tespiti. Veri Bilim Derg. 2021;4(3):113-122. https://izlik.org/JA37UZ84AL
Chicago
Köksal, Kübra, Buket Doğan, ve Zehra Aysun Altıkardeş. 2021. “Topluluk sınıflandırıcı kullanarak zararlı url tespiti”. Veri Bilimi 4 (3): 113-22. https://izlik.org/JA37UZ84AL.
EndNote
Köksal K, Doğan B, Altıkardeş ZA (01 Aralık 2021) Topluluk sınıflandırıcı kullanarak zararlı url tespiti. Veri Bilimi 4 3 113–122.
IEEE
[1]K. Köksal, B. Doğan, ve Z. A. Altıkardeş, “Topluluk sınıflandırıcı kullanarak zararlı url tespiti”, Veri Bilim Derg, c. 4, sy 3, ss. 113–122, Ara. 2021, [çevrimiçi]. Erişim adresi: https://izlik.org/JA37UZ84AL
ISNAD
Köksal, Kübra - Doğan, Buket - Altıkardeş, Zehra Aysun. “Topluluk sınıflandırıcı kullanarak zararlı url tespiti”. Veri Bilimi 4/3 (01 Aralık 2021): 113-122. https://izlik.org/JA37UZ84AL.
JAMA
1.Köksal K, Doğan B, Altıkardeş ZA. Topluluk sınıflandırıcı kullanarak zararlı url tespiti. Veri Bilim Derg. 2021;4:113–122.
MLA
Köksal, Kübra, vd. “Topluluk sınıflandırıcı kullanarak zararlı url tespiti”. Veri Bilimi, c. 4, sy 3, Aralık 2021, ss. 113-22, https://izlik.org/JA37UZ84AL.
Vancouver
1.Kübra Köksal, Buket Doğan, Zehra Aysun Altıkardeş. Topluluk sınıflandırıcı kullanarak zararlı url tespiti. Veri Bilim Derg [Internet]. 01 Aralık 2021;4(3):113-22. Erişim adresi: https://izlik.org/JA37UZ84AL