Zararlı yazılım kaynaklı veri kaçırma ataklarına karşı yeni bir doküman sınıflandırma algoritması
Öz
Günümüzde değerli verilerin saklanması ve sadece yetkili şahıs veya kurumlarca kullanılması önem arz etmektedir. Genel olarak verinin korunmasına yönelik geliştirilen veri sızıntısı önleme (Data Leakage Prevention-DLP) çözümleri zararlı yazılım kaynaklı saldırıları göz ardı etmekte, parmak izi (fingerprinting) eşleştirme ve kurallı ifadeler (regular expression) benzeri yöntemler kullanan algoritmalar yer almaktadır. Oysaki doküman içeriğine yönelik yapılan saldırılar neticesinde bu algoritmalar atlatılabilmektedir.
Zararlı yazılım kaynaklı veri sızıntısına karşı dayanıklı bir algoritmanın sunulduğu bu çalışmada, zararlı yazılımların saldırı türüne bağlı kalmayan bir çözüm önerilmektedir. Çalışma kapsamında, yer değiştirme, yapısal cümle saldırıları, modifikasyon saldırıları, karartma saldırıları ele alınmıştır. Bu saldırılara karşı yazım düzeltimi, kelime-gram ve karakter-gram, k-skip-n-gram ve LSA kullanılarak, saldırı altında daha iyi bir sınıflama yapılması için özellikler çıkarımı sağlanmıştır.
Çıkarılan özellikler, Karar Destek Makineleri, Rasgele Orman ve Çok Katmanlı Algılayıcı kullanarak Oylamalı Sınıflandırıcı ile en çok oy alan yönteme göre sınıflama tahmini yapılmıştır.
Ayrıca modifikasyon saldırılarında faydalı olan Yazım Düzeltme yönteminin etkisi farklı aşamalarda uygulanarak gösterilmiştir.
Anahtar Kelimeler
Destekleyen Kurum
Proje Numarası
Kaynakça
- S. Alneyadi, E. Sithirasenan, and V. Muthukkumarasamy, “A survey on data leakage prevention systems,” J. Netw. Comput. Appl., vol. 62, pp. 137–152, 2016.
- A. Maheshwari, “Report on Text Classification using CNN, RNN & HAN,” 2017. [Online]. Available: https://medium.com/jatana/report-on-text-classification-using-cnn-rnn-han-f0e887214d5f.
- T. Mustafa, “Malicious Data Leak Prevention and Purposeful Evasion Attacks: An approach to Advanced Persistent Threat (APT) management,” 2013 Saudi Int. Electron. Commun. Photonics Conf. SIECPC 2013, pp. 1–5, 2013.
- R. Tahboub and Y. Saleh, “Data leakage/loss prevention systems (DLP),” 2014 World Congr. Comput. Appl. Inf. Syst. WCCAIS 2014, 2014.
- M. Hart, P. Manadhata, and R. Johnson, “Text Classification for Data Loss Prevention,” pp. 18–37, 2011.
- Y. Canbay, H. Yazici, and S. Sagiroglu, “A Turkish language based data leakage prevention system,” 2017 5th Int. Symp. Digit. Forensic Secur. ISDFS 2017, 2017.
- B. Martins and M. J. Silva, “Spelling Correction for Search Engine Queries,” Adv. Nat. Lang. Process., pp. 372–383, 2004.
- F. Ahmed, “Revised n-gram based automatic spelling correction tool to improve retrieval effectiveness,” Res. J. Comput. …, no. 40, pp. 39–48, 2009.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Mühendislik
Bölüm
Araştırma Makalesi
Yazarlar
Yahya Kesenek
*
0000-0002-7571-234X
Türkiye
İbrahim Özçelik
0000-0001-9985-5268
Türkiye
Emrah Kaya
0000-0001-9050-2343
Türkiye
Yayımlanma Tarihi
28 Şubat 2022
Gönderilme Tarihi
1 Kasım 2019
Kabul Tarihi
24 Ekim 2021
Yayımlandığı Sayı
Yıl 2022 Cilt: 37 Sayı: 3