In this study the effects of distributions
and sizes on average test length and average classification accuracy in
computerized adaptive classification testings (CACT) were investigated. For
that purpose random item selection method (RISM), Maximum Fisher Information
(MFI) and Kullback-Leibler Information (KLI) were studied in broad and peaked
item pools with 50 items, 100 items, 200 items and 300 items. Thetas are
derived from N(0,1). In peaked item pools items are simulated from U[0,5; 2,0]
for a parameters, N(1, 0,4) for b parameters and N(0,15, 0,05) for c
parameters; and in broad item pools items are simulated from U[0,5; 2,0] for a
parameters, N(1, 1,5) for b parameters and N(0,15, 0,05) for c parameters. The simulation
study was performed in R results show that RISM has the maximum value with
respect to average test length; and MFI and KLI perform similar. The more items
in the pool, the shorter test length and fewer the classification accuracy but
in all conditions classification accuracy has high rate above 90%. In addition,
in peaked item pools it is seen that the average test lengths are getting
shorter and the test effectiveness is getting higher; but the classification
accuracies are not changing. In conclusion it can be said that with the peaked
item pools with more items, CACT provides shorter tests and high classification
accuracy.
Computerized adaptive classification testing item pool distribition item pool size test length classification accuracy
Bu çalışmada bireyselleştirilmiş bilgisayarlı
sınıflama testlerinde (BBST) madde havuzu özelliklerinden dağılım ve
büyüklüklerin ortalama test uzunluğu ve ortalama sınıflama doğruluğu üzerindeki
etkisi incelenmiştir. Bu amaçla, sivri ve basık dağılımlı 50, 100, 200 ve 300
maddelik madde havuzlarında; tesadüfi madde seçme yöntemi (TMSY), Maksimum
Fisher Bilgisi (MFB) ve Kullback-Leibler Bilgisi (KLB) yöntemleri
incelenmiştir. 1000 bireye ait yetenek parametreleri -3,3 aralığında N(0,1)
olacak şekilde türetilmiştir. Sivri dağılıma sahip madde havuzlarındaki
maddelerin a parametresi U[0,5; 2,0] aralığından; b parametresi N(1, 0,4) ve c
parametresi N(0,15, 0,05) şeklinde; basık dağılıma sahip madde havuzlarındaki
maddeler ise a parametresi U[0,5; 2,0] aralığından; b parametresi N(1, 1,5) ve
c parametresi N(0,15, 0,05) şeklinde türetilmiştir. R’da gerçekleştirilen
simülasyon sonucunda tüm madde havuzlarında ortalama test uzunluğu bakımından
en yüksek değerin TMSY’ye ait olduğu; MFB ve KLB yöntemlerinin birbirine
oldukça benzer çalıştıkları söylenebilir. Madde havuzu büyüklüğü arttıkça test
uzunluklarının kısaldığı; sınıflama doğruluklarının azaldığı ancak tüm
koşullarda 0,90 üstünde yüksek sınıflama doğruluğu elde edildiği görülmüştür.
Ayrıca sivri dağılıma sahip madde havuzlarında test uzunluğunun kısaldığı ve
test etkililiğinin arttığı; sınıflama doğruluklarının ise değişmediği
görülmüştür. Bu sonuçlar dikkate alındığında, BBST’de çok sayıda maddeden
oluşan sivri dağılıma sahip madde havuzları ile yüksek sınıflama doğruluğuna
sahip daha kısa testlerin oluşturulabileceği söylenebilir.
Bireyselleştirilmiş bilgisayarlı sınıflama testleri madde havuzu dağılımı madde havuzu büyüklüğü test uzunluğu sınıflama doğruluğu
Birincil Dil | Türkçe |
---|---|
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 31 Ekim 2018 |
Yayımlandığı Sayı | Yıl 2018 Cilt: 33 Sayı: 4 |