Multidimensional computer adaptive testing (MCAT) is capable of measuring
multiple dimensions efficiently by using multidimensional IRT (MIRT)
applications. There have been several research studies about MCAT item
selection methods to improve the overall ability score estimations accuracy. According to the literature review it
has been found that most studies focused on comparing item selection methods in
many conditions except for the structure of test design. In contrast with the
previous studies, this study employed various test design (simple and complex)
which allows the evaluation of the overall ability score estimations across
multiple real test conditions. In this study, four factors were manipulated,
namely the test design, number of items per dimension, correlation between
dimensions and item selection methods. Using the generated item and ability
parameters, dichotomous item responses were generated in by using M3PL
compensatory multidimensional IRT model with specified correlations. MCAT
composite ability score accuracy was evaluated using absolute bias (ABSBIAS),
correlation and the root mean square error (RMSE) between true and estimated
ability scores. The results suggest that the multidimensional test structure,
number of item per dimension and correlation between dimensions had significant
effect on item selection methods for the overall score estimations. For simple
structure test design it was found that V1 item selection has the lowest
absolute bias estimations for both long and short test while estimating overall
scores. As the model gets complex KL item selection method performed better
than other two item selection method.
Item selection method multidimensional computer adaptive testing multidimensional item response theory composite score estimation
Bu araştırmada diğer araştırmaların aksine toplam yetenek puanları gerçek
test koşullarına uygun olacak şekilde farklı test koşullarında
karşılaştırılmıştır (basit ve karmaşık). Araştırmada test deseni, boyut başına
düşen soru sayısı, boyutlar arası korelasyon ve madde seçme yöntemleri olmak
üzere dört koşul manipüle edilmiştir. Veri setleri, üretilen madde ve yetenek
parametreleri ve M3PL telafi edici çok boyutlu madde tepki kuramı modeli
kullanılarak belirlenen korelasyonlara bağlı kalarak üretilmiştir. Çok boyutlu
bireyselleştirilmiş bilgisayarlı test uygulamaları sonucu elde edilen toplam
yetenek puanları mutlak yanlılık (ABSBIAS), korelasyon ve hata kareleri
ortalamasının karekökü (RMSE) kullanılarak karşılaştırılmıştır. Sonuçlar
incelendiğinde çok boyutlu test deseni, boyut başına düşen madde sayısı ve
boyutlar arası korelasyon değişkenlerinin toplam puanları kestirmede madde
seçme yöntemleri üzerinde etkilerinin olduğu belirlenmiştir. Basit yapıdaki bir
test için Minimum Hata Varyansı madde seçme yönteminin hem uzun hem de kısa
testler için en düşük mutlak yanlılık değerinin ürettiği belirlenmiştir. Model
karmaşıklaştıkça Kullback-Leibler madde seçme yönteminin diğer iki yöntemden
daha iyi performans gösterdiği belirlenmiştir.
Madde seçme yöntemi çok boyutlu bireyselleştirilmiş bilgisayarlı test çok boyutlu maddde tepki kuramı toplam puan kestirimi
Journal Section | Articles |
---|---|
Authors | |
Publication Date | April 3, 2017 |
Acceptance Date | March 6, 2017 |
Published in Issue | Year 2017 Volume: 8 Issue: 1 |