As computers
and the internet become indispensable elements of everyday life, the number of
internet sites and web based applications have increased rapidly. The sharing
of information, ideas and money through internet sites and applications has
made information security an important and actual issue. Softwares such as
security walls and virus programs are used for computer and system security
have not been enough. For this reason, it is aimed to solve the possible
threats by detecting abnormal behaviors with the intrusion detection systems
that are proposed as an alternative to existing software. In this study, new
data sets are obtained by applying chi square, information gain, gain ratio,
gini coefficient, oneR, reliefF, genetic, forward and backward feature
selection algorithms on KDDCup99 dataset generated for intrusion detection
systems. In order to compare the new data sets obtained with the original size
data set, different models are developed by using k-nearest-neighbor, support vector
machines and extreme learning machines.
In this study, all three methods for test data having best results are
compared by using mentioned feature selection methods according to metrics such
as success rate, precision, false alarm error, f-measure. As the result of
experiments, it is seen that feature selection methods increases the success
rate and enables models to function faster for all three classification
methods. Besides, it shows that extreme learning machines are able to be
integrated to intrusion detection systems conveniently and be used as an
alternative method because of reasons such as having high success rate, being
faster than other classification methods and having simple training algorithm.
Intrusion Detection Machine Learning Feature Selection Extreme Learning Machine
Bilgisayar
ve internetin, günlük yaşamın vazgeçilmez bir unsuru haline gelmesi ile
birlikte internet sitelerinin ve web tabanlı uygulamaların sayısı da hızla
artmıştır. Bilgi, fikir, para gibi birçok önemli unsurun internet siteleri ve
uygulamalar aracılığıyla paylaşımının yapılması ise bilgi güvenliği konusunu
önemli ve güncel bir hale getirmiştir. Günümüze kadar güvenlik duvarı, virüs
programları gibi yazılımlar bilgisayar ve sistem güvenliği için kullanılmış
ancak yeterli olmamıştır. Bu nedenle mevcut yazılımlara alternatif olarak
ortaya atılan saldırı tespit sistemleri ile anormal davranışlar tespit edilerek
olası tehlikelerin çözümlenmesi amaçlanmıştır. Bu çalışmada ise saldırı tespit
sistemleri için üretilen KDDCup99 veri seti üzerinde ki kare, bilgi kazancı,
kazanım oranı, gini katsayısı, oneR, reliefF, genetik, ileriye doğru ve geriye
doğru öznitelik seçim algoritmaları uygulanarak yeni veri setleri elde
edilmiştir. Elde edilen yeni veri setlerini, orijinal boyuttaki veri seti ile
karşılaştırmak için en yakın k komşu, destek vektör makineleri ve aşırı öğrenme
makineleri kullanılarak farklı modeller geliştirilmiştir. Çalışmada, her üç yöntem için belirtilen
öznitelik seçme yöntemleri kullanılarak test verileri için en yüksek başarıma
sahip modeler başarı oranı, hassasiyet yanlış alarm oranı, f-ölçütü gibi
çeşitli metrikler yardımıyla karşılaştırılmıştır. Yapılan analizlerin sonucunda
öznitelik seçim yöntemlerinin her üç sınıflama yöntemi içinde başarı oranını
artırdığı ve modellerin daha hızlı çalışmasını sağladığı görülmüştür. Ayrıca,
yüksek başarı oranları, diğer sınıflama yöntemlerine oranla son derece hızlı
olması, eğitim algoritmasının basit
olması gibi nedenlerden dolayı aşırı öğrenme makinalarının çevrimiçi saldırı
tespit sistemlerine rahatlıkla entegre edilebileceğini ve alternatif bir yöntem
olarak kullanılabileceğini göstermiştir.
Saldırı Tespiti Makine Öğrenmesi Öznitelik Seçimi Aşırı Öğrenme Makineleri
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 30 Nisan 2018 |
Gönderilme Tarihi | 19 Aralık 2017 |
Yayımlandığı Sayı | Yıl 2018 |