Bu araştırmada
madde bazında kayıp veri oranlarının bulunduğu farklı örneklem büyüklüğündeki
verilere ait madde ve test parametrelerinin kayıp veri ile baş etme
yöntemlerinden nasıl etkilendiğini belirlemek amaçlanmıştır. PISA 2015
uygulamasına katılan ve çalışma içerisinde yer alan “hırs algısı” ölçeğine
cevap veren 5073 öğrenci içerisinden rastgele seçilen 500, 100 ve 2500 öğrenci,
araştırmanın çalışma grubunu oluşturmaktadır. Öncelikle her bir veri setinde
normallik, tek boyutluluk, yerel bağımsızlık ve model-veri uyumu varsayımları
incelenmiştir. Ölçekte 5 madde yer almaktadır ve kayıp veriler madde bazında
oluşturulmuştur. Bu doğrultuda tamamen rastsal olacak şekilde her bir maddeden
sırasıyla %5, %10, %15 ve %20’lik kayıp veriler oluşturulmuş, ölçek
maddelerinden birinde ise hiç kayıp veri olmayacak şekilde analizler
gerçekleştirilmiştir. Kayıp verilerin tamamen rastsal dağılım gösterdiği
belirlendikten sonra öncelikle tam ve eksik verilerle; daha sonra silme,
ortalama atama, yakın noktalar ortalama ataması, yakın noktalar medyan ataması,
doğrusal değerleme, noktada doğrusal eğilim, regresyon atama ve beklenti
maksimizasyonu yöntemleri sonucunda elde edilen tam veri setleri ile
hesaplamalar gerçekleştirilmiştir. Hesaplama sürecinde betimsel istatistikler
ve Cronbach-alfa güvenirlik katsayısı; ardından Madde Tepki Kuramına dayalı
Aşamalı Tepki Modeline göre ayırıcılık ve güçlük indeksleri ile marjinal
güvenirlik katsayısı hesaplanmıştır. Araştırma sonucunda madde ve test
parametrelerinin eksik veriden ve kayıp veri ile baş etme yöntemlerinden
etkilendiği; tam veri setine en yakın kestirimi sunan sonuçların doğrusal
değerleme yöntemi ile elde edildiği belirlenmiştir.
In this study,
the aim is to determine how the item and test parameters affect the missing
data techniques for different sample sizes and different items with different
missing data rates. 500, 100 and 2500 students randomly selected from the 5073
students who participated in the PISA 2015 study and responded to the
"ambition perception" scale included in the study constitute the
study group of the research. First of all, the assumptions of normality,
unidimensionality, local independence and model-data fit were examined for each
data set. Afterwards, 5%, 10%, 15%, and 20% missing data were formed for four
out of five items and there was no missing data in one item, then analyses were
carried out. Once it is determined that the missing data are missing completely
random, first with complete and incomplete data, then with serial mean, median
of nearby points, mean of nearby points, linear interpolation, linear trend at
point, regression, expectation maximization algorithm data item and test
parameters were estimated. In the estimated process, descriptive statistics and
cronbach alpha reliability coefficient and marginal reliability coefficient;
the threshold parameters and the difficulty indices were estimated according to
the graded response theory, which is one of the IRT models. The results of the
study showed that the item and test parameters were influenced by incomplete
and missing data techniques; it was determined that the best estimation results
were obtained by linear interpolation method with different data.
Journal Section | Articles |
---|---|
Authors | |
Publication Date | December 29, 2017 |
Acceptance Date | December 15, 2017 |
Published in Issue | Year 2017 Volume: 8 Issue: 4 |