In linear regression, penalized regression methods are used to obtain more accurate predictions depending on the structure of the data set. In addition, it is possible to determine the explanatory variables associated with the response variable by using penalized regression methods. In this study, the performances of ridge, LASSO, elastic net, adaptive LASSO convex penalized regression methods and SCAD and MCP non-convex penalized regression methods are compared depending on the properties of the true coefficient vector based on simulation studies. While the mean squared error on the test set is used to compare the prediction performance of the models based on the methods, the false classification rate, false positive rate and active set sizes are obtained to compare the performance of the methods in variable selection. According to the simulation studies, it has been observed that the structure of the true coefficient vector has a remarkable effect on the performance of the models created by convex and non-convex penalized regression methods.
Doğrusal regresyonda cezalı regresyon yöntemleri veri kümesinin yapısına bağlı olarak ön tahminde daha doğru sonuçlar elde edilmesi için kullanılır. Ayrıca cezalı regresyon yöntemleri kullanılarak yanıt değişken ile ilişkili olan açıklayıcı değişkenlerin tespiti mümkündür. Bu çalışmada ridge, LASSO, elastik net, uyarlamalı LASSO konveks cezalı regresyon yöntemleri ile SCAD ve MCP konveks olmayan cezalı regresyon yöntemlerinin gerçek katsayı vektörünün özelliklerine bağlı olarak performansları simülasyon çalışmaları ile karşılaştırılmıştır. Yöntemlere dayalı olarak oluşturulan modellerin ön tahmin performansının karşılaştırılması için test kümesi hata kareler ortalaması kullanılırken yöntemlerin değişken seçimindeki performanslarının karşılaştırılması için yanlış sınıflama oranı, yanlış pozitif oranı ve aktif küme büyüklükleri elde edilmiştir. Simülasyon çalışmalarına göre gerçek katsayı vektörünün yapısının konveks ve konveks olmayan cezalı regresyon yöntemleri ile oluşturulan modellerin performansı üzerinde kayda değer bir etkisinin olduğu görülmüştür.
Birincil Dil | Türkçe |
---|---|
Konular | Uygulamalı İstatistik |
Bölüm | Araştırma Makalesi |
Yazarlar | |
Erken Görünüm Tarihi | 6 Ocak 2024 |
Yayımlanma Tarihi | 19 Ocak 2024 |
Gönderilme Tarihi | 19 Mayıs 2023 |
Yayımlandığı Sayı | Yıl 2024 |