Araştırma Makalesi
BibTex RIS Kaynak Göster

Determining the effective variables by penalized regression methods: An application on diabetes data set

Yıl 2021, Cilt: 14 Sayı: 1, 105 - 112, 30.04.2021
https://doi.org/10.26559/mersinsbd.816561

Öz

Aim: Least Angle Regression (LARS) and Least Absolute Shrinkage Selection Operator (LASSO) methods, which have become quite popular in recent years, were discussed as an alternative to classical regression analysis in this study. It is aimed to compare the results of classical regression analysis with these penalized regression methods for determination the effective variables on diabetes dataset in terms of mean square error (MSE) and coefficient of determination (R2). Methods: Least Angle Regression, Least Absolute Shrinkage and Selection Operator and multiple regression methods were applied to data set of 442 patients diagnosed with diabetes. Results: Least Angle Regression and Least Absolute Shrinkage Selection Operator methods predict the model by selecting the same variables. However, these methods were better than multiple regression in terms of coefficient of determination and mean square error. Conclusion: Penalized regression methods constituted the best model for the diabetes data set with the least number of independent variables. These methods should be preferable to obtain significant models with fewer variables.

Kaynakça

  • Kaynaklar 1. Png ME, Yoong J, Tan CS, Chia KS. Excess Hospitalization Expenses Attributable to Type 2 Diabetes Mellitus in Singapore. Value in health regional issues. 2018; 15:106-111.
  • 2. 3. Organization WH. Global report on diabetes. 2016.
  • 3. Farbahari A, Dehesh T,Gozashti MH. The Usage Of Lasso,Ridge and Linear Regression to Explore The Most Influential Metabolic Variables That Affect Fasting Blood Sugar In Type 2 Diabetes Patients. Rom J Diabetes Nutr Metab Dis.2020; 26(4) :371-379.
  • 4. Alpar R. Çoklu Doğrusal Regresyon. İçinde: Alpar R. Uygulamalı Çok Değişkenli İstatistiksel Yöntemler.5.Baskı. Ankara: Detay Yayıncılık; 2017: 399-400.
  • 5. Tibshirani R. Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society. Series B.1996;58(1):267-288.
  • 6. Fonti V, Belitser E. Feature Selection Using Lasso. Research Paper In Business Analytics.2017.https://beta.vu.nl/nl/Images/werkstuk-fonti_tcm235-836234.pdf.
  • 7. Efron B, Hastie T, Johnstone I, Tibshirani R. Least Angle Regression. The Annals of Statistics. Institute of Mathematical Statistics.2004;32(2):407-499.
  • 8. Kayanan M, Wijekoon P. Performance of Lasso And Elastic Net Estimators in Misspecified Lineer Regression Model.Ceylon Journal Of Science. 2019;48(3):293-299.
  • 9. Hastie TJ, Tibshirani R, Friedman J. Linear Methods For Regression. İçinde: Hastie TJ, Tibshirani R, Friedman J. The Elements of Statistical Learning Data Mining,Inference and Prediction. 2nd ed. New York: Springer;2008: 61-73.
  • 10. Khan JA, Van Aelts S, Zamar R.H. Robust Linear Model Selection Based On Least Angle Regression. Journal of the American Statistical Association.2007;102(480):1289-1299.
  • 11. Januaviani Adelheid MT, Gusriani N, Joebaedi K, Supian S, Subiyanto. The Best Model Of LASSO With The LARS(Least Angle Regression and Shrinkage) Algorithm Using Mallow’s Cp. An International Scientific Journal.2019;116:245-252.
  • 12. Pripp AH, Stanisic M. Association between biomarkers and clinical characteristics in chronic subdural hematoma patients assessed with lasso regression. Plos One.2017;12(11):1-15.
  • 13. Anaraki JR, Usefi H. A Comparative Study of Feature Selection Methods on Genomic Datasets. 2019 IEEE 32nd International Symposium on Computer-Based Medical Systems (CBMS); June 5,2019;Cordoba, Spain.
  • 14. Zou H, Hastie T. Regularization and variable selection via the elastic net. J.Royal.Statis.Soc.B.2005;67(2):301-320.
  • 15. Gauthier PA, Scullion W, Berry A. Sound quality prediction based on systematic metric selection and shrinkage: Comparison of stepwise, lasso, and elastic-net algorithms and clustering preprocessing. Journal of Sound and Vibration.2017;400:134-153.
  • 16. Iturbide E, Cerda J, Graff M. A Comparison between LARS and LASSO for Initialising the Time-Series Forecasting Auto-Regressive Equations Procedia Technlogy.2013;7:282-2.

Etkili değişkenlerin cezalı regresyon yöntemleri ile belirlenmesi: Diyabet veri kümesi üzerine bir uygulama

Yıl 2021, Cilt: 14 Sayı: 1, 105 - 112, 30.04.2021
https://doi.org/10.26559/mersinsbd.816561

Öz

Amaç: Bu çalışmada etkili değişkenlerin bulunması amacıyla uygulanan klasik regresyon analizine alternatif olarak kullanılması önerilen ve son yıllarda sağlık verilerinde oldukça popüler hale gelen cezalı regresyon yöntemlerinden En Küçük Açı regresyonu (LARS) ve En Küçük Mutlak Küçülme ve Seçim Operatörü (LASSO) yöntemleri ele alınmıştır. Diyabet veri kümesi üzerine etkili değişkenlerin belirlenmesinde cezalı regresyon yöntemleri ve klasik regresyon analizi sonuçlarının hata kareler ortalaması (HKO) ve belirtme katsayıları (R2) bakımından karşılaştırılması amaçlanmıştır. Yöntem: Diyabet tanısı almış 442 hastaya ait veri kümesine En Küçük Açı regresyonu, En Küçük Mutlak Küçülme ve Seçim Operatörü ve çoklu doğrusal regresyon yöntemleri uygulanmıştır. Bulgular: En Küçük Açı regresyonu ve En Küçük Mutlak Küçülme ve Seçim Operatörü regresyon yöntemleri aynı değişkenleri seçerek model tahmini yapmıştır. Cezalı regresyon yöntemleri, belirtme katsayıları ve hata kareler ortalamaları dikkate alındığında çoklu doğrusal regresyondan daha iyi sonuçlar vermiştir. Sonuç: Diyabet veri seti için cezalı regresyon yöntemleri ile en az sayıda ve modeli en iyi açıklayan değişkenler elde edilmiştir. Daha az sayıda değişkenle anlamlı modeller oluşturulmak istendiğinde tercih edilebilir yöntemlerdir.

Kaynakça

  • Kaynaklar 1. Png ME, Yoong J, Tan CS, Chia KS. Excess Hospitalization Expenses Attributable to Type 2 Diabetes Mellitus in Singapore. Value in health regional issues. 2018; 15:106-111.
  • 2. 3. Organization WH. Global report on diabetes. 2016.
  • 3. Farbahari A, Dehesh T,Gozashti MH. The Usage Of Lasso,Ridge and Linear Regression to Explore The Most Influential Metabolic Variables That Affect Fasting Blood Sugar In Type 2 Diabetes Patients. Rom J Diabetes Nutr Metab Dis.2020; 26(4) :371-379.
  • 4. Alpar R. Çoklu Doğrusal Regresyon. İçinde: Alpar R. Uygulamalı Çok Değişkenli İstatistiksel Yöntemler.5.Baskı. Ankara: Detay Yayıncılık; 2017: 399-400.
  • 5. Tibshirani R. Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society. Series B.1996;58(1):267-288.
  • 6. Fonti V, Belitser E. Feature Selection Using Lasso. Research Paper In Business Analytics.2017.https://beta.vu.nl/nl/Images/werkstuk-fonti_tcm235-836234.pdf.
  • 7. Efron B, Hastie T, Johnstone I, Tibshirani R. Least Angle Regression. The Annals of Statistics. Institute of Mathematical Statistics.2004;32(2):407-499.
  • 8. Kayanan M, Wijekoon P. Performance of Lasso And Elastic Net Estimators in Misspecified Lineer Regression Model.Ceylon Journal Of Science. 2019;48(3):293-299.
  • 9. Hastie TJ, Tibshirani R, Friedman J. Linear Methods For Regression. İçinde: Hastie TJ, Tibshirani R, Friedman J. The Elements of Statistical Learning Data Mining,Inference and Prediction. 2nd ed. New York: Springer;2008: 61-73.
  • 10. Khan JA, Van Aelts S, Zamar R.H. Robust Linear Model Selection Based On Least Angle Regression. Journal of the American Statistical Association.2007;102(480):1289-1299.
  • 11. Januaviani Adelheid MT, Gusriani N, Joebaedi K, Supian S, Subiyanto. The Best Model Of LASSO With The LARS(Least Angle Regression and Shrinkage) Algorithm Using Mallow’s Cp. An International Scientific Journal.2019;116:245-252.
  • 12. Pripp AH, Stanisic M. Association between biomarkers and clinical characteristics in chronic subdural hematoma patients assessed with lasso regression. Plos One.2017;12(11):1-15.
  • 13. Anaraki JR, Usefi H. A Comparative Study of Feature Selection Methods on Genomic Datasets. 2019 IEEE 32nd International Symposium on Computer-Based Medical Systems (CBMS); June 5,2019;Cordoba, Spain.
  • 14. Zou H, Hastie T. Regularization and variable selection via the elastic net. J.Royal.Statis.Soc.B.2005;67(2):301-320.
  • 15. Gauthier PA, Scullion W, Berry A. Sound quality prediction based on systematic metric selection and shrinkage: Comparison of stepwise, lasso, and elastic-net algorithms and clustering preprocessing. Journal of Sound and Vibration.2017;400:134-153.
  • 16. Iturbide E, Cerda J, Graff M. A Comparison between LARS and LASSO for Initialising the Time-Series Forecasting Auto-Regressive Equations Procedia Technlogy.2013;7:282-2.
Toplam 16 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Sağlık Kurumları Yönetimi
Bölüm Araştırma Makalesi
Yazarlar

Didem Derici Yıldırım 0000-0001-7709-6133

Ali Türker Çiftçi 0000-0002-0227-5273

Yayımlanma Tarihi 30 Nisan 2021
Gönderilme Tarihi 26 Ekim 2020
Kabul Tarihi 9 Aralık 2020
Yayımlandığı Sayı Yıl 2021 Cilt: 14 Sayı: 1

Kaynak Göster

APA Derici Yıldırım, D., & Çiftçi, A. T. (2021). Etkili değişkenlerin cezalı regresyon yöntemleri ile belirlenmesi: Diyabet veri kümesi üzerine bir uygulama. Mersin Üniversitesi Sağlık Bilimleri Dergisi, 14(1), 105-112. https://doi.org/10.26559/mersinsbd.816561
AMA Derici Yıldırım D, Çiftçi AT. Etkili değişkenlerin cezalı regresyon yöntemleri ile belirlenmesi: Diyabet veri kümesi üzerine bir uygulama. Mersin Univ Saglık Bilim Derg. Nisan 2021;14(1):105-112. doi:10.26559/mersinsbd.816561
Chicago Derici Yıldırım, Didem, ve Ali Türker Çiftçi. “Etkili değişkenlerin Cezalı Regresyon yöntemleri Ile Belirlenmesi: Diyabet Veri kümesi üzerine Bir Uygulama”. Mersin Üniversitesi Sağlık Bilimleri Dergisi 14, sy. 1 (Nisan 2021): 105-12. https://doi.org/10.26559/mersinsbd.816561.
EndNote Derici Yıldırım D, Çiftçi AT (01 Nisan 2021) Etkili değişkenlerin cezalı regresyon yöntemleri ile belirlenmesi: Diyabet veri kümesi üzerine bir uygulama. Mersin Üniversitesi Sağlık Bilimleri Dergisi 14 1 105–112.
IEEE D. Derici Yıldırım ve A. T. Çiftçi, “Etkili değişkenlerin cezalı regresyon yöntemleri ile belirlenmesi: Diyabet veri kümesi üzerine bir uygulama”, Mersin Univ Saglık Bilim Derg, c. 14, sy. 1, ss. 105–112, 2021, doi: 10.26559/mersinsbd.816561.
ISNAD Derici Yıldırım, Didem - Çiftçi, Ali Türker. “Etkili değişkenlerin Cezalı Regresyon yöntemleri Ile Belirlenmesi: Diyabet Veri kümesi üzerine Bir Uygulama”. Mersin Üniversitesi Sağlık Bilimleri Dergisi 14/1 (Nisan 2021), 105-112. https://doi.org/10.26559/mersinsbd.816561.
JAMA Derici Yıldırım D, Çiftçi AT. Etkili değişkenlerin cezalı regresyon yöntemleri ile belirlenmesi: Diyabet veri kümesi üzerine bir uygulama. Mersin Univ Saglık Bilim Derg. 2021;14:105–112.
MLA Derici Yıldırım, Didem ve Ali Türker Çiftçi. “Etkili değişkenlerin Cezalı Regresyon yöntemleri Ile Belirlenmesi: Diyabet Veri kümesi üzerine Bir Uygulama”. Mersin Üniversitesi Sağlık Bilimleri Dergisi, c. 14, sy. 1, 2021, ss. 105-12, doi:10.26559/mersinsbd.816561.
Vancouver Derici Yıldırım D, Çiftçi AT. Etkili değişkenlerin cezalı regresyon yöntemleri ile belirlenmesi: Diyabet veri kümesi üzerine bir uygulama. Mersin Univ Saglık Bilim Derg. 2021;14(1):105-12.

MEÜ Sağlık Bilimleri Dergisi Doç.Dr. Gönül Aslan'ın Editörlüğünde Mersin Üniversitesi Sağlık Bilimleri Enstitüsüne bağlı olarak 2008 yılında yayımlanmaya başlanmıştır. Prof.Dr. Gönül Aslan Mart 2015 tarihinde Başeditörlük görevine Prof.Dr. Caferi Tayyar Şaşmaz'a devretmiştir. 01 Ocak 2023 tarihinde Prof.Dr. C. Tayyar Şaşmaz Başeditörlük görevini Prof.Dr. Özlem İzci Ay'a devretmiştir. 

Yılda üç sayı olarak (Nisan - Ağustos - Aralık) yayımlanan dergi multisektöryal hakemli bir bilimsel dergidir. Dergide araştırma makaleleri yanında derleme, olgu sunumu ve editöre mektup tipinde bilimsel yazılar yayımlanmaktadır. Yayın hayatına başladığı günden beri eposta yoluyla yayın alan ve hem online hem de basılı olarak yayımlanan dergimiz, Mayıs 2014 sayısından itibaren sadece online olarak yayımlanmaya başlamıştır. TÜBİTAK-ULAKBİM Dergi Park ile Nisan 2015 tarihinde yapılan Katılım Sözleşmesi sonrasında online yayın kabul ve değerlendirme sürecine geçmiştir.

Mersin Üniversitesi Sağlık Bilimleri Dergisi 16 Kasım 2011'dan beri Türkiye Atıf Dizini tarafından indekslenmektedir.

Mersin Üniversitesi Sağlık Bilimleri Dergisi 2016 birinci sayıdan itibaren ULAKBİM Tıp Veri Tabanı tarafından indekslenmektedir.

Mersin Üniversitesi Sağlık Bilimleri Dergisi 02 Ekim 2019'dan beri DOAJ tarafından indekslenmektedir.

Mersin Üniversitesi Sağlık Bilimleri Dergisi 23 Mart 2021'den beri EBSCO tarafından indekslenmektedir.


Dergimiz açık erişim politikasını benimsemiş olup, dergimizde makale başvuru, değerlendirme ve yayınlanma aşamasında ücret talep edilmemektedir. Dergimizde yayımlanan makalelerin tamamına ücretsiz olarak Arşivden erişilebilmektedir.

154561545815459   

Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı  ile lisanslanmıştır.