Karma Testlerde İç Tutarlılık Kestirimlerinin Farklı Benzetim Koşullarında İncelenmesi

Yıl 2020, Cilt: 20 Sayı: 87, 101 - 118, 20.05.2020


Problem Durumu: Alanyazın incelendiğinde karma testlerde güvenirlik üzerine yapılan az sayıda araştırma olduğu görülmüştür. Bu araştırmalarda farklı madde tipleri farklı oranlarda kullanılmıştır. Ancak madde tipi oranlarının ve örneklem büyüklüğünün birlikte güvenirlik üzerindeki etkisini inceleyerek bu yöntemlerin karşılaştırıldığı bir araştırmaya rastlanmamıştır. Karma testlerde kullanılacak madde tipleri ve bunların sayısı, ayrıca güvenirlik kestirimleri için gerekli örneklem büyüklüğü, önemli tartışma ve sorun alanları arasındadır. Bu bağlamda; karma testlerde iç tutarlılık anlamında güvenirlik hesaplamalarında kullanılan katsayıların, karma testlerin yapısını belirleyen önemli değişkenler olarak farklı madde tipi oranı ve örneklem büyüklüğü dikkate alındığında, bu katsayıların nasıl değiştiği, ideal/ daha uygun katsayıların hangileri olduğu bu araştırmanın problem durumunu oluşturmaktadır.

Araştımanın Amacı: Bu araştırmanın araştırmada, karma testlerde örneklem büyüklüğü (500, 1000 ve 2000) ve kullanılan madde tiplerinin oranı (2:1; 1:1 ve 1:2) değişimlendiğinde; α, Tabakalı α, Angoff-Feldt ve Feldt-Raju güvenirlik katsayılarının nasıl değiştiğinin incelenmesi ve bu güvenirlik katsayıları arasındaki betimsel ilişkinin ortaya konması amaçlanmıştır.

Araştırmanın Yöntemi: Araştırma için belirlenen koşullara uygun veri üretmek için; WinGen program kullanmıştır. Araştırma kapsamında oluşturulan koşullarda madde tipi sayısı, very türetmede kullanılan model, toplam madde sayısı, yanıt kategori sayısı, toplam puan alma yöntemi, madde ayırıcılığı ve madde güçlüğü sabit tutulurken; örneklem büyüklüğü ve madde tipi oranı için değişimlemeler yapılmıştır. Sabit tutulan ve üzerinde değişimleme yapılan değişkenler için ilgili alanyazın dikkate alınmıştır. Theta, her bir örneklem büyüklüğü için; ortalaması 0.00 ve standart sapmaları 1.00 olan normal dağılıma uygun olacak şekilde üretilmiştir. İki kategorili puanlanan maddeler İki Parametreli Lojistik Model'le, çok kategorili puanlanan maddeler Kısmi Puan Modeli ile üretilmiştir. Örneklem sayısı (500, 1000 ve 2000) ve madde oranları (2:1, 1:1 ve 1:2) olacak şekilde değişimlenmiş ve ilk beş adım bu koşulların her biri için tekrarlanmıştır. Veri üretiminde 25 tekrar(replikasyon) yapılmıştır. Böylelikle, 3x3=9 farklı deneysel koşul için 9x25=225 farklı veri seti üretilmiştir. Elde edilen very setlerine ait her bir koşul ve tekrar için α, Tabakalı α, Angoff-Feldt ve Feldt-Raju değerleri hesaplanmış ve tablolaştırılmıştır. Bu tablo değerleri, ortalama ve standart hatalar dikkate alınarak betimsel düzeyde değerlendirilmiş ve yorumlanmıştır.


Examining of Internal Consistency Coefficients in Mixed-Format Tests in Different Simulation Conditions

Yıl 2020, Cilt: 20 Sayı: 87, 101 - 118, 20.05.2020


Purpose: The present study aims to evaluate how the reliabilities computed using α, Stratified α, Angoff-Feldt, and Feldt-Raju estimators may differ when sample size (500, 1000, and 2000) and item type ratio of dichotomous to polytomous items (2:1; 1:1, 1:2) included in the scale are varied.

Research Methods: In this study, Cronbach’s α, Stratified α, Angoff-Feldt, and Feldt-Raju reliability coefficients were estimated on simulated datasets (sample sizes 500, 1000, 2000) and the number of dichotomous versus polytomous item ratios (2:1, 1:1, 1:2).

In the simulation conditions of this research, in all sample size conditions, estimated Angoff-Feldt, and Feldt-Raju reliability coefficients were higher when the number of dichotomous items in the item-type ratio was higher than that of polytomous items. This was also the case for the estimated α and Stratified α reliability coefficients when the item-type ratio was reversed. While all different reliability estimators gave similar results in the large samples (n≥1000), there were some differences in reliability estimates depending on the item-type ratio in the small samples (n=500).

Implications for Research and Practice: In the light of the findings and conclusions obtained in this study, it may be advisable to use α and Stratified α for mixed-type scales when the number of polytomously scored items in the scale is higher than that of the dichotomously scored items. On the other hand, the coefficients Angoff-Feldt and Feldt-Raju are recommended when the number of items scored dichotomously is higher.


Birincil Dil İngilizce
Bölüm Makaleler

Hatice Gurdıl Ege Bu kişi benim 0000-0002-0079-3202

Ergul Demır Bu kişi benim 0000-0002-3708-8013

Yayımlanma Tarihi 20 Mayıs 2020
Yayımlandığı Sayı Yıl 2020 Cilt: 20 Sayı: 87

