Nesnelerin interneti (IoT), hayatımızın her alanında kullanılan ve her geçen gün internetteki veri sayısını artıran muazzam miktarda veri üretmektedir. Akıllı saatler, robot süpürgeler, kameralı buzdolapları ve daha kullanılan birçok cihaz IoT cihazları olarak kabul edilebilir. Ayrıca gelişen teknoloji ile birlikte hayatımızın her alanında olan internete erişim kolaylığı insanlara avantajlar sağladığı gibi dezavantajlar da sağlamaktadır. Kötü amaçlı yazılımlar ve saldırganlar, yoğun olarak kullandığımız cihazlara ve önemli bilgilerimize internet üzerinden daha kolay erişebilmektedir. Bu noktada özellikle IoT cihazlarında veri gizliliği ve güvenliği büyük önem kazanmaktadır çünkü kullandığımız akıllı saatler veya kullandığımız buzdolapları aracılığıyla kişisel verilerimize erişim bireyler ve aileleri için büyük bir tehdit oluşturabilmektedir. Tüm bu durumlar göz önüne alındığında bu çalışma, veri ön işlemenin önemine ve IoT cihazları için hibrit bir makine öğrenmesi tabanlı saldırı tespit sistemi (IDS) geliştirmeye odaklanmaktadır. Çalışmada yapılacak araştırmalar için popüler bir makine öğrenme algoritması olan Karar Ağacı ve n_Balot veri kümesi tercih edilmiştir. Buna göre veri azaltma işlemi ve özellik seçimi ile n_Balot veri kümesine K-means ve Karar Ağacı algoritmaları uygulanarak saldırı tespiti yapan hibrit bir model oluşturulması amaçlanmıştır. Veri ön işlemede, Ki-Kare seçim yöntemi ile özellik seçimi ve RandomOverSampling yöntemi ile veri azaltma işlemleri yapılmıştır. Daha sonra veri sayısı azaltılmış ve özellik seçimi gerçeklenerek işlenmiş veri kümesine K-Means algoritması uygulanarak kümeleme yapılmış ve kümeleme ile elde edilen sonuçlar Karar ağacı algoritması ile sınıflandırılmıştır. Yapılan tüm incelemeler sonucunda hiçbir işlem yapılmadan yani veri ön işleme ve özellik seçimi gerçekleştirmeden sadece Karar Ağacı ile yapılan tahminlerde hata oranı %0,39 iken, geliştirilen hibrit model ile hata oranı %0,01'e düşürülmüştür.
Internet of Things (IoT) produces an enormous amount of data, which is used in all areas of our lives and increases the number of data on the Internet with each passing day. Smart watches, robot vacuum cleaners, refrigerators with cameras, and more can all be considered IoT devices. Ease of access to the Internet provides people with advantages as well as disadvantages. Malware and intruders have easier access to the devices we use and our information via the internet. At this point, data security gains great importance especially in IoT devices because accessing our personal data via smart watches or refrigerators we use can pose a great threat to individuals and their families. This study focus the importance of data preprocessing and developing a hybrid machine learning-based intrusion detection system (IDS) for IoT. Decision Tree, which is a popular machine learning algorithm, and n_Balot dataset were preferred for investigations. Accordingly, it is aimed to create a hybrid model by applying K-means and Decision Tree algorithms to the n_Balot dataset with under sampling and feature selection. In the data preprocessing, feature selection was performed with Chi-Square method and under sampling performed with RandomOverSampling method. Then, clustering was done by applying K-means to the processed dataset, and the results obtained with the clustering were classified with the Decision tree algorithm. As a result of the study, while the error rate was 0.39% in the predictions made only with the decision tree, the error rate was reduced to 0.01% with the developed hybrid model.
Primary Language | English |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors | |
Publication Date | December 1, 2021 |
Published in Issue | Year 2021 |