TR
EN
Genomik Veri Setlerinin LASSO ve Elastik Net Regresyon Yöntemleri ile Analizi
Abstract
Amaç: Bu çalışmanın amacı büyük boyutlu genomik veri setlerinin değişken seçim yöntemleri kullanılarak daha küçük boyutlara indirgenip daha az maliyet ve zaman ile analizlerin gerçekleştirilebileceğini göstermektir.
Gereç ve Yöntem: Bu çalışmada NCBI veri tabanından Bioconductor yardımı ile R programına aktarılan GDS4906 numaralı veri seti kullanılmıştır. Veri seti 10-katlı çapraz doğrulama ile LASSO ve Elastik Net regresyon yöntemleri kullanılarak analiz edilmiştir.
Bulgular: Veri seti LASSO regresyon yöntemi ile analiz edildiğinde veri setinden 5 adet gen seçilmiş olup, sonrasında farklı iterasyonlarda seçilen değişkenler ve değişken sayılarında farklılık gözlendiğinden kararlılık seçimi yöntemi uygulanarak 2 adet gen seçilmiş ve modelin R2 değeri 0,85 olarak bulunmuştur. Aralıklı arama yöntemi kullanılarak uygulanan Elastik Net regresyon yönteminde 19 adet gen seçilmiş ve R2 değeri 0,92 olarak bulunmuştur.
Sonuç: Elde edilen sonuçlara göre LASSO ve Elastik Net regresyon yöntemlerinin genomik veri setlerinde iyi bir performans gösterdiği anlaşılmıştır.
Gereç ve Yöntem: Bu çalışmada NCBI veri tabanından Bioconductor yardımı ile R programına aktarılan GDS4906 numaralı veri seti kullanılmıştır. Veri seti 10-katlı çapraz doğrulama ile LASSO ve Elastik Net regresyon yöntemleri kullanılarak analiz edilmiştir.
Bulgular: Veri seti LASSO regresyon yöntemi ile analiz edildiğinde veri setinden 5 adet gen seçilmiş olup, sonrasında farklı iterasyonlarda seçilen değişkenler ve değişken sayılarında farklılık gözlendiğinden kararlılık seçimi yöntemi uygulanarak 2 adet gen seçilmiş ve modelin R2 değeri 0,85 olarak bulunmuştur. Aralıklı arama yöntemi kullanılarak uygulanan Elastik Net regresyon yönteminde 19 adet gen seçilmiş ve R2 değeri 0,92 olarak bulunmuştur.
Sonuç: Elde edilen sonuçlara göre LASSO ve Elastik Net regresyon yöntemlerinin genomik veri setlerinde iyi bir performans gösterdiği anlaşılmıştır.
Keywords
References
- [1] Khuri, A. I. 2013. Introduction to Linear Regression Analysis. 4th edition by Douglas C. Montgomery, Elizabeth A. Peck, G. Geoffrey Vining. International Statistical Review.
- [2] Pripp, A. H., Stanišić, M. 2017. Association between biomarkers and clinical characteristics in chronic subdural hematoma patients assessed with lasso regression. PLoS ONE 12(11).
- [3] Kohannim, O., et al. 2012. Discovery and Replication of Gene Influences on Brain Structure Using LASSO Regression. Front Neurosci, 6(115).
- [4] Çiftsüren, N. M., Akkol, S. 2018. Prediction of internal egg quality characteristics and variable selection using regularization methods: ridge, LASSO and elastic net. Archives Animal Breeding, 61(3), 279-284.
- [5] Cho, S., Kim, H., Oh, S., Kim, K., Park, T. 2009. Elastic-net regularization approaches for genome-wide association studies of rheumatoid arthritis. BMC Proc., 3(7), 25.
- [6] KOAH Veri seti. 2013. NCBI, National Center for Biotechnology Information. https://www.ncbi.nlm.nih.gov/sites/GDSbrowser?acc=GDS4906 (Erişim Tarihi: 10.01.2022).
- [7] Tibshirani, R. 1996. Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society: Series B (Statistical Methodology),58(1), 267-288.
- [8] Zou, H., Hastie, T. 2005. Regularization and Variable Selection via the Elastic Net. Journal of the Royal Statistical Society: Series B (Statistical Methodology),67(2), 301-320.
Details
Primary Language
Turkish
Subjects
Health Care Administration
Journal Section
Research Article
Publication Date
December 20, 2022
Submission Date
November 10, 2022
Acceptance Date
November 29, 2022
Published in Issue
Year 2022 Volume: 13 Number: 3
APA
Vergili, M., & Orhan, H. (2022). Genomik Veri Setlerinin LASSO ve Elastik Net Regresyon Yöntemleri ile Analizi. Süleyman Demirel Üniversitesi Sağlık Bilimleri Dergisi, 13(3), 485-496. https://doi.org/10.22312/sdusbed.1201417
AMA
1.Vergili M, Orhan H. Genomik Veri Setlerinin LASSO ve Elastik Net Regresyon Yöntemleri ile Analizi. Süleyman Demirel Üniversitesi Sağlık Bilimleri Dergisi. 2022;13(3):485-496. doi:10.22312/sdusbed.1201417
Chicago
Vergili, Merve, and Hikmet Orhan. 2022. “Genomik Veri Setlerinin LASSO Ve Elastik Net Regresyon Yöntemleri Ile Analizi”. Süleyman Demirel Üniversitesi Sağlık Bilimleri Dergisi 13 (3): 485-96. https://doi.org/10.22312/sdusbed.1201417.
EndNote
Vergili M, Orhan H (December 1, 2022) Genomik Veri Setlerinin LASSO ve Elastik Net Regresyon Yöntemleri ile Analizi. Süleyman Demirel Üniversitesi Sağlık Bilimleri Dergisi 13 3 485–496.
IEEE
[1]M. Vergili and H. Orhan, “Genomik Veri Setlerinin LASSO ve Elastik Net Regresyon Yöntemleri ile Analizi”, Süleyman Demirel Üniversitesi Sağlık Bilimleri Dergisi, vol. 13, no. 3, pp. 485–496, Dec. 2022, doi: 10.22312/sdusbed.1201417.
ISNAD
Vergili, Merve - Orhan, Hikmet. “Genomik Veri Setlerinin LASSO Ve Elastik Net Regresyon Yöntemleri Ile Analizi”. Süleyman Demirel Üniversitesi Sağlık Bilimleri Dergisi 13/3 (December 1, 2022): 485-496. https://doi.org/10.22312/sdusbed.1201417.
JAMA
1.Vergili M, Orhan H. Genomik Veri Setlerinin LASSO ve Elastik Net Regresyon Yöntemleri ile Analizi. Süleyman Demirel Üniversitesi Sağlık Bilimleri Dergisi. 2022;13:485–496.
MLA
Vergili, Merve, and Hikmet Orhan. “Genomik Veri Setlerinin LASSO Ve Elastik Net Regresyon Yöntemleri Ile Analizi”. Süleyman Demirel Üniversitesi Sağlık Bilimleri Dergisi, vol. 13, no. 3, Dec. 2022, pp. 485-96, doi:10.22312/sdusbed.1201417.
Vancouver
1.Merve Vergili, Hikmet Orhan. Genomik Veri Setlerinin LASSO ve Elastik Net Regresyon Yöntemleri ile Analizi. Süleyman Demirel Üniversitesi Sağlık Bilimleri Dergisi. 2022 Dec. 1;13(3):485-96. doi:10.22312/sdusbed.1201417
Cited By
Çoklu bağlantı sorununda Ridge, Liu ve LASSO tahmin edicilerinin kullanımı: yumurta tavukçuluğunda bir uygulaması
Veteriner Hekimler Derneği Dergisi
https://doi.org/10.33188/vetheder.1554543Advanced non-destructive detection of peanut adulteration in ground roasted hazelnut using FT-NIR spectroscopy and machine learning
Food Additives & Contaminants: Part A
https://doi.org/10.1080/19440049.2025.2540982Toprak Organik Karbonu Ölçek Küçültme Işlemi Için Farklı Makine Öğrenmesi Algoritmalarının Karşılaştırılması: Kahramanmaraş/Ekinözü İlçesi Örneklem Alanı
Artvin Çoruh Üniversitesi Orman Fakültesi Dergisi
https://doi.org/10.17474/artvinofd.1638494