Çoklu Değerlendirici ve Tanı Testinin Kategorik Olması Durumunda Uyum İstatistiklerinin Karşılaştırılması: Bir Simülasyon Çalışması

Cilt: 19 Sayı: 4 1 Ağustos 2012
  • E. Arzu Kanık
  • Gülhan Örekici Temel
  • Semra Erdoğan
  • İrem Ersöz Kaya
PDF İndir
EN TR

Çoklu Değerlendirici ve Tanı Testinin Kategorik Olması Durumunda Uyum İstatistiklerinin Karşılaştırılması: Bir Simülasyon Çalışması

Öz

Amaç: Değerlendirici sayısının ve tanı testine ait kategori sayısının iki ve daha fazla olduğu durumda, uyum istatistiklerinin, örneklem büyüklüğünden, değerlendirici sayısından ve kullanılan ölçeğin kategori sayısından etkilenme durumlarını ortaya koymaktır. Gereç ve Yöntem: Değerlendiriciler arasında hiç uyumun olmadığı durum ile uyumun 0.90 olduğu durumlara ait AC1 istatistiği, Fleiss Kappa ve Krippendorff Alpha değerleri 1000 simülasyon denemesi için kaydedilmiştir. Bulgular: Değerlendiriciler arasındaki beklenen uyumun 0.90 olduğu durumda; AC1 istatistiği ve Fleiss kappa katsayısı, örneklem büyüklüğü, değerlendirici sayısı ve tanı testine ait kategori sayısı ne olursa olsun tüm kombinasyonlarda benzer sonuçlar vermekte ve beklenen uyum değerine eşit değerler almaktadır. Krippendorff Alpha katsayısı incelendiğinde, örneklem büyüklüğünden etkilenmediği ancak değerlendirici sayısından ve tanı testine ait kategori sayısından etkilenmektedir. Sonuç: Prevelans değeri biliniyor ve çalışma için önem taşıyorsa, Gwet'in AC1 istatistiğinin, eğer çalışmada eksik verilerin varlığı söz konusu ise Krippendorff Alpha katsayısının, bu sözü edilen durumlar dışında Fleiss kappa katsayısının kullanılması önerilmektedir. Anahtar kelimeler: Fleiss Kappa; Gwet'in AC1 Istatistiği; Krippendorff Alpha; Değerlendiriciler Arası Uyum.

Anahtar Kelimeler

Kaynakça

  1. Gwet K. Computing inter-rater reliability and its variance in the presence of high agreement.Brit J Mathematic Stat Psychol 2008;61:29-48.
  2. Gwet K. Kappa statistics is not satisfactory for assessing the extent of agreement between raters.Series: Stat Met Inter- Rater Reliab Asses 2002;1:1-5.
  3. Gwet K. Handbook of Inter-Rater Reliability;1st rev ed. USA: STATAXIS Publishing Company; 2001.
  4. Krippendorff K. Reliability in content analysis some common misconceptions and recommendations. Hum Commun Res 2004;30:411-33.
  5. Hayes AF, Krippendorff K. Answering thecall for a standard reliability measure for coding data.Com Method Measur 2007;1:77-89.
  6. Kanık EA, Orekici Temel G, Ersöz Kaya İ. Effect of sample size, the number of raters and the category levels of diagnostic test on Krippendorff Alpha and the Fleiss Kappa statistics for calculating inter-rater agreement: a simulation study. Türkiye Klinikleri J Biostat 2010;2:74-81.
  7. Zhou X, Obuchowski N, McClish D. Statistical Methods in Diagnostic Medicine, 1st rev ed; New York: Wiley. 2002.
  8. Fleiss JL. Measuring nominal scale agreement among many raters. Psychol Bull 1971;76:378-82.

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

-

Yazarlar

E. Arzu Kanık Bu kişi benim

Gülhan Örekici Temel Bu kişi benim

Semra Erdoğan Bu kişi benim

İrem Ersöz Kaya Bu kişi benim

Yayımlanma Tarihi

1 Ağustos 2012

Gönderilme Tarihi

20 Şubat 2015

Kabul Tarihi

-

Yayımlandığı Sayı

Yıl 2012 Cilt: 19 Sayı: 4

Kaynak Göster

APA
Kanık, E. A., Temel, G. Ö., Erdoğan, S., & Kaya, İ. E. (2012). Çoklu Değerlendirici ve Tanı Testinin Kategorik Olması Durumunda Uyum İstatistiklerinin Karşılaştırılması: Bir Simülasyon Çalışması. Journal of Turgut Ozal Medical Center, 19(4), 220-227. https://izlik.org/JA43XJ27KU
AMA
1.Kanık EA, Temel GÖ, Erdoğan S, Kaya İE. Çoklu Değerlendirici ve Tanı Testinin Kategorik Olması Durumunda Uyum İstatistiklerinin Karşılaştırılması: Bir Simülasyon Çalışması. J Turgut Ozal Med Cent. 2012;19(4):220-227. https://izlik.org/JA43XJ27KU
Chicago
Kanık, E. Arzu, Gülhan Örekici Temel, Semra Erdoğan, ve İrem Ersöz Kaya. 2012. “Çoklu Değerlendirici ve Tanı Testinin Kategorik Olması Durumunda Uyum İstatistiklerinin Karşılaştırılması: Bir Simülasyon Çalışması”. Journal of Turgut Ozal Medical Center 19 (4): 220-27. https://izlik.org/JA43XJ27KU.
EndNote
Kanık EA, Temel GÖ, Erdoğan S, Kaya İE (01 Ağustos 2012) Çoklu Değerlendirici ve Tanı Testinin Kategorik Olması Durumunda Uyum İstatistiklerinin Karşılaştırılması: Bir Simülasyon Çalışması. Journal of Turgut Ozal Medical Center 19 4 220–227.
IEEE
[1]E. A. Kanık, G. Ö. Temel, S. Erdoğan, ve İ. E. Kaya, “Çoklu Değerlendirici ve Tanı Testinin Kategorik Olması Durumunda Uyum İstatistiklerinin Karşılaştırılması: Bir Simülasyon Çalışması”, J Turgut Ozal Med Cent, c. 19, sy 4, ss. 220–227, Ağu. 2012, [çevrimiçi]. Erişim adresi: https://izlik.org/JA43XJ27KU
ISNAD
Kanık, E. Arzu - Temel, Gülhan Örekici - Erdoğan, Semra - Kaya, İrem Ersöz. “Çoklu Değerlendirici ve Tanı Testinin Kategorik Olması Durumunda Uyum İstatistiklerinin Karşılaştırılması: Bir Simülasyon Çalışması”. Journal of Turgut Ozal Medical Center 19/4 (01 Ağustos 2012): 220-227. https://izlik.org/JA43XJ27KU.
JAMA
1.Kanık EA, Temel GÖ, Erdoğan S, Kaya İE. Çoklu Değerlendirici ve Tanı Testinin Kategorik Olması Durumunda Uyum İstatistiklerinin Karşılaştırılması: Bir Simülasyon Çalışması. J Turgut Ozal Med Cent. 2012;19:220–227.
MLA
Kanık, E. Arzu, vd. “Çoklu Değerlendirici ve Tanı Testinin Kategorik Olması Durumunda Uyum İstatistiklerinin Karşılaştırılması: Bir Simülasyon Çalışması”. Journal of Turgut Ozal Medical Center, c. 19, sy 4, Ağustos 2012, ss. 220-7, https://izlik.org/JA43XJ27KU.
Vancouver
1.E. Arzu Kanık, Gülhan Örekici Temel, Semra Erdoğan, İrem Ersöz Kaya. Çoklu Değerlendirici ve Tanı Testinin Kategorik Olması Durumunda Uyum İstatistiklerinin Karşılaştırılması: Bir Simülasyon Çalışması. J Turgut Ozal Med Cent [Internet]. 01 Ağustos 2012;19(4):220-7. Erişim adresi: https://izlik.org/JA43XJ27KU