Konferans Bildirisi
BibTex RIS Kaynak Göster

Dengesiz Veri Setli Sağkalım Verilerinde Cox Regresyon ve Rastgele Orman Yöntemlerin Karşılaştırılması

Yıl 2020, Cilt: 3 Sayı: 1, 21 - 25, 13.07.2020

Öz

Cox regresyon modeli, temel
olarak, hastaların sağkalım süresi ile bir veya daha fazla faktörlerin yaşam
süreleri üzerindeki etkilerini incelemek amacıyla yaygın olarak kullanılan bir
regresyon modelidir. Yüksek sayıdaki verilerin oluşu, verilerde doğrusal
olmayan durum, yüksek derecede etkileşim ve yüksek boyutlu ilişkileri
açıklamada kullanılabilecek Cox Regresyon yöntemine alternatif olarak  makine öğrenme yöntemleri kullanılmaya
başlanılmıştır. Bu çalışmada, veri seti Ondokuz Mayıs Üniversitesi göğüs
hastalıkları servisinde yatmakta olan akut lösemi hastalarından elde
edilmiştir. Analizden önce, çıktı değişkenin kategorisindeki dengesizliği düzeltmek
için sentetik azınlık aşırı örnekleme (Smote) yöntemi uygulandı.  Daha sonra, her hastanın riskini belirmek
için rastgele orman ve Cox Regresyon yöntemleri kullanılmıştır. Bu iki yöntem
uyum indeks, roc eğrisinin altında elde edilen alan (AUC) ve hata oranına göre
karşılaştırılmıştır. Sonuç olarak, rastgele orman sağkalım  analizinde Cox regresyonuna alternatif bir
yöntem olarak kullanabilir.

Teşekkür

“Bu çalışmanın bir kısmı ICONDATA 2019 konferansında sözlü olarak sunulmuştur.”

Kaynakça

  • [1] Kleinbaum, D.G. (1998). Survival analysis, a self‐learning text. Biometrical Journal: Journal of Mathematical Methods in biosciences, 40(1), 107-108.[2] Biau, G. (2012). Analysis of a random forests model. Journal of machine research. 13, 1063-1095.[3] Weathers, B. (2017). Comparision of survival curves between Cox proportional hazards, random forests, and conditional inference forests in survival analysis. Utah State University.[4] Dirican, A. (2004). Kliniğimizde akciğer kanseri tanısı alan hastaların prospektif olarak değerlendirilmesi ve sağkalıma etki eden faktörlerin belirlenmesi, Ondokuz Mayıs University.[5] Chawla, N.V., et al. (2002). Smote: synthetic minority over-sampling technique. Journal of artificial intelligence research. 16, 321-357.[6] Breiman, L. (2001). Random forests. Machine learning, 45(1), 5-32.

Comparison of Cox Regression and Random Forest Methods Survival Data with Imbalanced Data Set

Yıl 2020, Cilt: 3 Sayı: 1, 21 - 25, 13.07.2020

Öz

The Cox proportional-hazards model is essentially a regression model commonly used statistical in medical research for investigating the association between the survival time of patients and one or more factors . Alternative machine learning methods were introduced to the Cox Regression method, which can be used to explain the high number of data, nonlinear status, higher-order interactions and high dimensional covariates. In this study, patients who have been in Chest diseases service in the Hospital of Ondokuz Mayıs University. Before analysis, the smote sampling method was applied because the categories of the output variable were unbalanced. In this study, Random Forest and Cox Regression were used to determine the risk of each patient in leukemia. These two methods are compared to the C-index, area under the ROC curve (AUC) and error rate. According to the result, it was found that random forest is used as an alternative to Cox regression in survival analysis.

Kaynakça

  • [1] Kleinbaum, D.G. (1998). Survival analysis, a self‐learning text. Biometrical Journal: Journal of Mathematical Methods in biosciences, 40(1), 107-108.[2] Biau, G. (2012). Analysis of a random forests model. Journal of machine research. 13, 1063-1095.[3] Weathers, B. (2017). Comparision of survival curves between Cox proportional hazards, random forests, and conditional inference forests in survival analysis. Utah State University.[4] Dirican, A. (2004). Kliniğimizde akciğer kanseri tanısı alan hastaların prospektif olarak değerlendirilmesi ve sağkalıma etki eden faktörlerin belirlenmesi, Ondokuz Mayıs University.[5] Chawla, N.V., et al. (2002). Smote: synthetic minority over-sampling technique. Journal of artificial intelligence research. 16, 321-357.[6] Breiman, L. (2001). Random forests. Machine learning, 45(1), 5-32.
Toplam 1 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Bölüm Makaleler
Yazarlar

Pelin Akın

Yüksel Terzi

Yayımlanma Tarihi 13 Temmuz 2020
Yayımlandığı Sayı Yıl 2020 Cilt: 3 Sayı: 1

Kaynak Göster

APA Akın, P., & Terzi, Y. (2020). Dengesiz Veri Setli Sağkalım Verilerinde Cox Regresyon ve Rastgele Orman Yöntemlerin Karşılaştırılması. Veri Bilimi, 3(1), 21-25.



Dergimizin Tarandığı Dizinler (İndeksler)


Academic Resource Index

logo.png

journalseeker.researchbib.com

Google Scholar

scholar_logo_64dp.png

ASOS Index

asos-index.png

Rooting Index

logo.png

www.rootindexing.com

The JournalTOCs Index

journal-tocs-logo.jpg?w=584

www.journaltocs.ac.uk

General Impact Factor (GIF) Index

images?q=tbn%3AANd9GcQ0CrEQm4bHBnwh4XJv9I3ZCdHgQarj_qLyPTkGpeoRRmNh10eC

generalif.com

Directory of Research Journals Indexing

DRJI_Logo.jpg

olddrji.lbp.world/indexedJournals.aspx

I2OR Index

8c492a0a466f9b2cd59ec89595639a5c?AccessKeyId=245B99561176BAE11FEB&disposition=0&alloworigin=1

http://www.i2or.com/8.html



logo.png