Research Article
BibTex RIS Cite

Çarpık dağılımlı verilerde ROC eğrisi altında kalan alan tahmininde transformasyon etkili mi?

Year 2018, Volume: 43 Issue: 1, 141 - 147, 31.03.2018
https://doi.org/10.17826/cutf.309430

Abstract

Amaç: Hasta ve sağlıklı grupta ölçülen sayısal ölçümlü tanı testinin dağılımının çarpık olması halinde ROC eğrisi altında kalan alan tahmini için kullanılan yöntemleri karşılaştırmaktır.

Gereç ve Yöntem: ROC eğrisi altında kalan alan tahmini parametrik ve parametrik olmayan yöntemler kullanılarak yapılabilmektedir. Parametrik yaklaşımlarda sayısal ölçümün hasta ve sağlıklı gruplarında normal dağılım gösterdiği veya dönüşüm teknikleri ile dağılımın normal dağılıma dönüştürülebileceği varsayılmaktadır. Parametrik olmayan yaklaşımlarda ise eğri altında kalan alan sıra istatistikleri kullanılarak hesaplanabildiği gibi, eğrinin çekirdek düzgünleştirme yöntemleri ile elde edilen olasılık yoğunluk fonksiyonu kullanılarak da hesaplanabilmektedir. Bu çalışmada parametrik ve parametrik olmayan yöntemler çarpık olarak üretilmiş veriler ve bir gerçek veri seti kullanılarak karşılaştırılmıştır. 

Bulgular: Simülasyon çalışmalarında, yöntemlerin gerçek alan değeri tahminleri gerçek alan değeri, örneklem büyüklüğü ve çarpıklık derecesine göre değişim göstermektedir. Normal dağılımdan üretilen çarpık verilerde Mann Whitney yöntemi en az hatayı yaparken, Gamma dağılımından üretilen çarpık verilerde ise normale dönüşüm sonrası Binormal modeli en az hatayı yapmıştır.

Sonuç: Çarpık dağılımlı verilerde dönüşüm teknikleri ile parametrik yöntemler kullanılarak ROC eğrisi altında kalan alan değeri tahmin edilebilir. Çarpıklık derecesi fazla olan verilerde parametrik yöntemlerin alan tahmin değerleri gerçek değere daha yakın olduğundan çarpık dağılımlı verilere Box-Cox dönüşümünü uygulamak önerilir.


Is the transformation useful to estimate the area under the ROC curve with skewed data?

Year 2018, Volume: 43 Issue: 1, 141 - 147, 31.03.2018
https://doi.org/10.17826/cutf.309430

Abstract

Purpose: The aim of this study is to compare the methods used for the estimation of the area under the ROC curve (AUC) with skewed data.

Materials and Methods: The area under the ROC curve can be estimated by using parametric or nonparametric methods. In the parametric method, the distributions of biomarker in both patient and non-patient groups are assumed to be normal distribution or transformed to the normal distribution. In non-parametric methods, there are two approaches: using the rank statistics or using the kernel smoothing methods. In this study, these methods are compared by using simulated skewed data and real data.

Results: According to the simulation results, the estimates of the investigated methods are affected by the real AUC value, the sample size and the degree of the skewness. For the scenarios with the skewed normal distribution, Mann Whitney method gets the smallest bias value and for the scenario with the gamma distribution, Binormal model with a Box-Cox transformation gets the smallest bias value. 

Conclusion: For skewed data, after applying transformation techniques, the Binormal model can be used to estimate the AUC. After Box-Cox transformation, the estimate of the Binormal model is very close to the real AUC value for highly skewed data. It is recommended to use this method for this situation. 


There are 0 citations in total.

Details

Primary Language Turkish
Subjects Health Care Administration
Journal Section Research
Authors

İlker Ünal

Publication Date March 31, 2018
Acceptance Date April 27, 2017
Published in Issue Year 2018 Volume: 43 Issue: 1

Cite

MLA Ünal, İlker. “Çarpık dağılımlı Verilerde ROC eğrisi altında Kalan Alan Tahmininde Transformasyon Etkili Mi?”. Cukurova Medical Journal, vol. 43, no. 1, 2018, pp. 141-7, doi:10.17826/cutf.309430.