Feature selection methods are very important for machine learning. As the size of the dataset increases, the performance of the machine learning model decreases. The feature selection method can also be considered as an optimization process. Success can be improved by eliminating noisy or irrelevant attributes for the model. In this study, 3 different datasets from the UCI repository were used and 5 different machine learning algorithms were used to measure the performance and runtime of the algorithms using 10-fold cross-validation. As feature selection methods, traditional machine learning feature selection methods and meta-heuristic algorithms were used for feature selection. The feature selection methods used are as follows; Correlation Analysis, Lasso, Hypothesis testing and metaheuristic algorithms Genetic Algorithm and Particle Swarm Optimization Algorithm. As a result of the experiments, it is seen that the performance increases with the application of feature selection methods. It was observed that feature selection with metaheuristic algorithms is more suitable in terms of performance and runtime.
Feature selection Metaheuristic Algorithms Machine Learning Genetic Algorithms Particle Swarm Optimization Algorithm
Öznitelik seçim yöntemleri, makine öğrenmesi için çok önemli bir yere sahiptir. Veri kümesinin boyutu arttıkça makine öğrenmesi modelinin performansı düşmektedir. Öznitelik seçim yöntemi aynı zamanda bir optimizasyon süreci olarak düşünülebilmektedir. Gürültülü olan ya da model için alakasız olan öznitelikler elenince başarı artabilmektedir. Bu çalışma kapsamında UCI veri deposundan 3 farklı veri kümesi kullanılmış ve 5 farklı makine öğrenmesi algoritması kullanılarak 10 katlı çapraz doğrulama yöntemiyle algoritmaların başarımları ve çalışma süreleri ölçülmüştür. Öznitelik seçim yöntemi olarak geleneksel makine öğrenmesi ile öznitelik seçim yöntemleri ve meta sezgisel algoritmalar kullanılarak öznitelik seçim işlemleri gerçekleştirilmiştir. Kullanılan öznitelik seçim yöntemleri şu şekildedir; Korelasyon Analizi, Lasso, Hipotez testi ve metasezgisel algoritmalardan Genetik Algoritma ve Parçacık Sürü Optimizasyon Algoritması yöntemleri kullanılmıştır. Yapılan deneyler sonucunda öznitelik seçim yöntemlerinin uygulanması ile birlikte başarımın arttığı görülmektedir. Metasezgisel algoritmalarla yapılan öznitelik seçiminin başarım ve çalışma süresi bakımından daha uygun olduğu gözlemlenmiştir.
Öznitelik seçimi metasezgisel algoritmalar makine öğrenmesi genetik algoritmalar parçacık sürü optimizasyon algoritması
Birincil Dil | Türkçe |
---|---|
Konular | Makine Öğrenme (Diğer) |
Bölüm | Makaleler |
Yazarlar | |
Erken Görünüm Tarihi | 30 Haziran 2024 |
Yayımlanma Tarihi | |
Gönderilme Tarihi | 13 Mart 2024 |
Kabul Tarihi | 17 Mayıs 2024 |
Yayımlandığı Sayı | Yıl 2024 Cilt: 15 Sayı: 2 |