Araştırma Makalesi

Kötücül URL Filtreleme için Derin Öğrenme Modeli Tasarımı

Sayı: 29 1 Aralık 2021
PDF İndir
TR EN

Kötücül URL Filtreleme için Derin Öğrenme Modeli Tasarımı

Öz

Web saldırılarında yeni tekniklerin kullanımı ile birlikte birçok web uygulaması çeşitli güvenlik tehditlerine ve ağ saldırılarına maruz kalmaktadır. URL adresleri de bu güvenlik mimarisinin odak noktasını oluşturmaktadır. Birçok web uygulamasına URL adresleri üzerinden erişim sağlanmaktadır. Bu durum siber korsanların, URL adreslerini suç işlemek için kullanabilecekleri bir araç haline getirmektedir. Son kullanıcıları korumak amacıyla bu adreslerin tespit edilerek nasıl filtreleneceği çözülmesi gereken bir problemdir. Bu çalışmada kötü amaçlı URL adreslerinin tespiti için derin öğrenme ağı(DNN) tasarlanmıştır. Çalışmanın ilk aşamasında URL adresleri metin tabanlı analiz yapılarak işlenmiştir. Sonrasında 1 giriş, 3 gizli ve 1 çıkış katmanından oluşan DNN modeli sınıflandırma için eğitilmiştir. Model ISCX-URL2016 veriseti ile test edilmiş olup deneysel sonuçlar önerilen yapının yüksek hassasiyetli sınıflandırma için uygun olduğunu göstermiştir. Verisetinde iyicil 7781, tahrif edilmiş 7930, kimlik avı 7586, kötü amaçlı yazılım dağıtan 6712 ve spam türünde 6698 örnek bulunmaktadır. Her bir örnek için 79 özellik bulunmaktadır. Deneyler sonucunda 5 sınıftan oluşan problem için %95,4 doğruluk, %95,5 kesinlik, %95,4 duyarlılık ve f skoru değerine ulaşılmıştır. Bu çalışmanın birinci aşamasında Doc2Vec ağı kullanılarak özellikler çıkarılmıştır. Doc2Vec kullanılarak yapılan sınıflandırmada çok sınıflı problem için alınan %88.1 doğruluk değeri, bu çalışmada %95,4’e yükseltilmiştir. Metin tabanlı analizin vektör tabanlı analize göre çoklu sınıflandırma için daha başarılı olduğu gösterilmiştir. Sonuçta, web sitelerini ziyaret edenlerin niyetlerini belirlemek için URL adreslerini kullanmak etkin bir yöntemdir. Derin öğrenme modellerinin kullanılması web araştırmaları için önemli teorik ve bilimsel değere sahiptir ve güvenlik internet ortamı için farklı imkânlar sağlamaktadır.

Anahtar Kelimeler

Kaynakça

  1. Shen He, Bangling Li, Huaxi Peng, Jun Xin, Erpeng Zhang, “An effective cost-sensitive Xgboot method for malicious URLs detection in imbalanced dataset”, IEEE Access, 9, 1-8, 2021.
  2. Malware variety grows by 13.7% in 2019 due to web skimmers, https://www.kaspersky.com/about/press-releases/2019_malware-variety-grows-by-137-in-2019-due-to-web-skimmers, 12/12/2019.
  3. Jianting Yuan, Guanxin Chen, Shenwwei Tian, Xinjun Pei, “Malicious URL detecion based on a parallel neural joint model”, IEEE Access, 9, 1-9, 2021.
  4. M. Indra Devi, K. Selvakuberan, R. Rajaram, “Fast web page classification without accessing the web page using machine learning techiques”, JIIK, 1(1), 1-10, 2009.
  5. Gopinath Palaniappan, Sangeetha S., Balaji Rajendran, Sanjay, Shubham Goyal, Bindhumadhava B S., “Malicious domain detection using machine learning on domain name features, host-based features and web-based features”, 3rd international conference on computing and network communications (CoCoNet’19), 171, 654-661, 2020.
  6. Jeff Ebeling, Domain Age as an Internet Filter Criteria, https://www.mcafee.com/blogs/enterprise/cloud-security/domain-age-as-an-internet-filter-criteria/, 17/02/2021.
  7. Matija Stevanoviz, Jens Myrup Pedersen, Alessandro D’Aconzo, Stefan Ruehrup, Andread Berger, “On the ground truth problem of malicious DNS traffic analyis”, Computer & Security, 55, 142-158, 2015.
  8. Yung-Tsung Hou, Yimeng Chang, Tsuhan Chen, Chi-Sun Laih, “Malicious web content detection by machine learning”, Expert systems with applications 37(1), 55-60, 2010.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

1 Aralık 2021

Gönderilme Tarihi

19 Ekim 2021

Kabul Tarihi

9 Aralık 2021

Yayımlandığı Sayı

Yıl 2021 Sayı: 29

Kaynak Göster

APA
Arslan, R. S. (2021). Kötücül URL Filtreleme için Derin Öğrenme Modeli Tasarımı. Avrupa Bilim ve Teknoloji Dergisi, 29, 122-128. https://doi.org/10.31590/ejosat.1011961

Cited By