Veri boyutlarındaki artışla birlikte araştırmacılar analiz aşamasını daha kolay hale getirmek için çeşitli yöntemlere ihtiyaç duymuşlardır. Veri boyutunu indirgemek ve analiz doğruluğu artırmak önem arz etmektedir. Veri analiz edilirken gereksiz alanlarla uğraşmamak ve daha az girdi ile daha doğru sonuç çıkarmak gerekmektedir. Öznitelik seçimi ve veri analindeki en önemli ilk aşamalardan birisidir. Öznitelik seçerken çeşitli makine öğrenmesi yöntemleri kullanılmaktadır. Çalışmada Tek Değişkenli Öznitelik seçimi, Özyinelemeli Öznitelik Eleme, Ağaç Tabanlı Öznitelik Seçimi ve Temel Bileşen Analizi yöntemleri kullanılmıştır. Bu yöntemlerle veri setindeki 14 öznitelik içenden en önemli olanları tespit edilmiştir. En önemli 6, 5, ve 4 öznitelik ayrı ayrı girdi olarak Rastgele Orman algoritması ile siber saldırı yöntemi tahmini yapılmıştır. Öznitelik sayısı 4’e indirgendiğinde en yüksek doğruluk oranı olan %97.24 elde edilmiştir. Bu oran öznitelik seçiminde ilişkili özniteliklerin tahmine dahil edilmesinin boyut ve hız açısından önemli olduğu sonucuna ulaşılmıştır. Elde edilen sonuçlarla birlikte öznitelik seçiminin veri üzerindeki önemi bir kez daha ortaya koyulmuştur.
Primary Language | Turkish |
---|---|
Journal Section | FBD |
Authors | |
Publication Date | March 27, 2022 |
Submission Date | November 2, 2021 |
Published in Issue | Year 2022 Volume: 34 Issue: 1 |