Araştırma Makalesi

Çoklu Doğrusal Bağlantılı Nadir Olayların Modellenmesinde Lasso ve Ridge Regresyon ile Boosting Algoritmalarının Performans Karşılaştırması

Cilt: 9 Sayı: 1 29 Haziran 2024
PDF İndir
EN TR

Çoklu Doğrusal Bağlantılı Nadir Olayların Modellenmesinde Lasso ve Ridge Regresyon ile Boosting Algoritmalarının Performans Karşılaştırması

Öz

Bu çalışma, iki durumlu olayları modellemek için kullanılan makine öğrenmesi tekniklerinde karşılaşılan nadirlik ve “çoklu doğrusal bağlantı” ya da sadece “çoklu bağlantı” olarak tanımlanan sorunu ele alınmaktadır. Çoklu doğrusal bağlantı (ÇDB), bağımsız değişkenler arasında bir ya da birden fazla kuvvetli doğrusal bağımlılık olma durumudur ve bir sorun olarak ortaya çıkar. Üzerinde çalışılan veri içerisinde çoklu doğrusal bağlantı probleminin var olması regresyon katsayılarının varyanslarının büyümesi gibi olumsuz bir sonuca sebebiyet verir. Bu çalışmada, Lasso ve Ridge Regresyon ile GradientBoost, XGBoost, LightGBM ve AdaBoost gibi artırma algoritmaları içeren düzenleme ve ölçeklendirme tekniklerinin, çoklu doğrusal bağlantılı nadir olayların modellenmesinde, algoritmaların performanslarını karşılaştırmak için detaylı bir simülasyon çalışması sunulmaktadır. Simülasyon çalışmasında, verideki dengesizliği ortadan kaldırmak amacıyla yeniden örnekleme yöntemleri kullanılarak sonuçlara etkisi Hata Kareler Ortalaması (HKO), R^2, Hassasiyet (Precision-Prec), Duyarlılık (Recall-Rec) ve Eğri Altında Kalan Alan (Area Under the Curve-AUC) gibi performans metrikleri ve İşlem Karakteristik Eğrisi (Receiver Operating Characteristic- ROC) grafikleri ile araştırılmaktadır. Sonuçlar Lasso, Ridge ve Boosting algoritmalarının ÇDB’ya sahip nadir olayların modellenmesinde hangi yöntemin uygun olduğunu belirlemek açısından katkı sunmaktadır.

Anahtar Kelimeler

Kaynakça

  1. Bayman, O. E., & Dexter, F. (2021). Multicollinearity in logistic regression models. Anesthesi̇a & Analgesi̇a, 133(2), 362-365. https://doi: 10.1213/ane.0000000000005593
  2. King, G., & Zeng, L. (2001). Logistic regression in rare events data. Poli̇ti̇cal Analysi̇s, 9(2), 137-163. https://doi:10.1093/oxfordjournals.pan.a004868
  3. Maalouf, M., & Trafalis, T. B. (2011). Robust weighted kernel logistic regression in imbalanced and rare events data. Computati̇onal Stati̇sti̇cs & Data Analysi̇s, 55(1), 168-183. https://doi:10.1016/j.csda.2010.06.014
  4. Shrivastava, S., Jeyanthi, P. M., & Singh, S. (2020). Failure prediction of Indian Banks using SMOTE, Lasso regression, bagging and Boosting. Cogent Economics & Finance, 8(1), 1729569. https://doi.org/10.1080/23322039.2020.1729569
  5. Rochayani, M. Y., Sa'adah, U., & Astuti, A. B. (2020). Finding biomarkers from a high-dimensional imbalanced dataset using the hybrid method of random undersampling and lasso. Comtech: Computer, Mathemati̇cs and Engi̇neeri̇ng Appli̇cati̇ons, 11(2), 75-81. https://doi:10.21512/comtech.v11i2.6452
  6. Cahyana, N., Khomsah, S., & Aribowo, A. S. (2019). Improving imbalanced dataset classification using oversampling and gradient Boosting [Bildiri sunumu]. 5th international conference on science in information technology (ICSITech), China.
  7. Tanha, J., Abdi, Y., Samadi, N., Razzaghi, N., & Asadpour, M. (2020). Boosting methods for multi-class imbalanced data classification: an experimental review. Journal of Big Data, 7, 1-47. https://doi.org/10.1186/s40537‑020‑00349‑y
  8. Ashraf, M. T., Dey, K., & Mishra, S. (2023). Identification of high-risk roadway segments for wrong-way driving crash using rare event modeling and data augmentation techniques. Accident Analysis & Prevention, 181, 106933. https://doi.org/10.1016/j.aap.2022.106933

Ayrıntılar

Birincil Dil

Türkçe

Konular

İstatistik (Diğer)

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

29 Haziran 2024

Gönderilme Tarihi

9 Şubat 2024

Kabul Tarihi

21 Mayıs 2024

Yayımlandığı Sayı

Yıl 2024 Cilt: 9 Sayı: 1

Kaynak Göster

APA
Alpay, O. (2024). Çoklu Doğrusal Bağlantılı Nadir Olayların Modellenmesinde Lasso ve Ridge Regresyon ile Boosting Algoritmalarının Performans Karşılaştırması. Sinop Üniversitesi Fen Bilimleri Dergisi, 9(1), 154-166. https://doi.org/10.33484/sinopfbd.1434260
AMA
1.Alpay O. Çoklu Doğrusal Bağlantılı Nadir Olayların Modellenmesinde Lasso ve Ridge Regresyon ile Boosting Algoritmalarının Performans Karşılaştırması. Sinopfbd. 2024;9(1):154-166. doi:10.33484/sinopfbd.1434260
Chicago
Alpay, Olcay. 2024. “Çoklu Doğrusal Bağlantılı Nadir Olayların Modellenmesinde Lasso ve Ridge Regresyon ile Boosting Algoritmalarının Performans Karşılaştırması”. Sinop Üniversitesi Fen Bilimleri Dergisi 9 (1): 154-66. https://doi.org/10.33484/sinopfbd.1434260.
EndNote
Alpay O (01 Haziran 2024) Çoklu Doğrusal Bağlantılı Nadir Olayların Modellenmesinde Lasso ve Ridge Regresyon ile Boosting Algoritmalarının Performans Karşılaştırması. Sinop Üniversitesi Fen Bilimleri Dergisi 9 1 154–166.
IEEE
[1]O. Alpay, “Çoklu Doğrusal Bağlantılı Nadir Olayların Modellenmesinde Lasso ve Ridge Regresyon ile Boosting Algoritmalarının Performans Karşılaştırması”, Sinopfbd, c. 9, sy 1, ss. 154–166, Haz. 2024, doi: 10.33484/sinopfbd.1434260.
ISNAD
Alpay, Olcay. “Çoklu Doğrusal Bağlantılı Nadir Olayların Modellenmesinde Lasso ve Ridge Regresyon ile Boosting Algoritmalarının Performans Karşılaştırması”. Sinop Üniversitesi Fen Bilimleri Dergisi 9/1 (01 Haziran 2024): 154-166. https://doi.org/10.33484/sinopfbd.1434260.
JAMA
1.Alpay O. Çoklu Doğrusal Bağlantılı Nadir Olayların Modellenmesinde Lasso ve Ridge Regresyon ile Boosting Algoritmalarının Performans Karşılaştırması. Sinopfbd. 2024;9:154–166.
MLA
Alpay, Olcay. “Çoklu Doğrusal Bağlantılı Nadir Olayların Modellenmesinde Lasso ve Ridge Regresyon ile Boosting Algoritmalarının Performans Karşılaştırması”. Sinop Üniversitesi Fen Bilimleri Dergisi, c. 9, sy 1, Haziran 2024, ss. 154-66, doi:10.33484/sinopfbd.1434260.
Vancouver
1.Olcay Alpay. Çoklu Doğrusal Bağlantılı Nadir Olayların Modellenmesinde Lasso ve Ridge Regresyon ile Boosting Algoritmalarının Performans Karşılaştırması. Sinopfbd. 01 Haziran 2024;9(1):154-66. doi:10.33484/sinopfbd.1434260

Cited By


Sinopfbd' de yayınlanan makaleler CC BY-NC 4.0 ile lisanslanmıştır.  88x31.png