Çok Kategorili Parametrik ve Parametrik Olmayan Madde Tepki Kuramı Modellerinin Karşılaştırılması
Abstract
Bu araştırmanın amacı çok kategorili maddeler için Parametrik Madde Tepki Kuramı (PMTK) kapsamındaki Aşamalı Tepki Modeli (ATM) ve Parametrik olmayan Madde Tepki Kuramı (PoMTK) kapsamındaki Monoton Homojenlik Modeli (MHM) ile yapılan kestirimlere örneklem büyüklüğü, örneklem dağılımı, testte yer alan madde sayısı, testte yer alan maddelerin yanıt kategorisi sayıları bağımsız değişkenlerinin etkilerini incelemektir. Bu amaca ulaşabilmek için araştırma; örneklem büyüklüğü, örneklem dağılımı, madde sayısı, maddenin kategori sayısı değişkenleri ile belirlenen 192 simülasyon koşulu desenlenen temel bir çalışma olarak gerçekleştirilmiştir. Örneklem büyüklüğü (N=100, 250, 500, 1000), örneklem dağılımı (normal dağılım, çarpıklık katsayısı -1,0 olan dağılım), madde sayısı (10, 20, 40, 80), maddenin yanıt kategorisi sayısı (3, 5, 7) koşulları için ATM ve MHM ile yapılan kestirimler sırasıyla model veri uyumları, güvenirlik değerleri, madde parametrelerinin standart hataları hesaplanarak incelenmiştir. Araştırma sonucunda ATM’de model veri uyumu hesaplanırken değerlerin değişken artışından etkilenmesi, tek başına yorumlanamaması bu değerlerin karşılaştırılması ve genellenmesini zorlaştırmaktadır. MHM’de model veri uyumunun pratik olarak hesaplanması, başka bir değere ihtiyaç duyulmadan tek başına yorumlanması ATM’ye göre üstünlük sağlamaktadır. Diğer bir araştırma sonucu güvenirlik değerlerinin iki model için benzer sonuç vermesidir. MHM için hesaplanan parametrelerin, küçük örneklem ve kısa test koşullarında standart hataları ATM kestirimlerine göre oldukça düşüktür ve MHM için hesaplanan parametrelerin standart hataları tüm koşullarda birbirine yakın değer almıştır.
Keywords
References
- Ankenmann, R. D & Stone, C.A. (1992). A monte carlo study of marginal maximum likelihood parameter estimates fort he graded model. Paper presented at the Annual Meeting of the Council on Measurement in Education, SanFrancisco, CA.
- Crocker L. & Algina, J. (1986). Introduction to classical and modern the test theory. NY: CBS College Publishing.
- De Ayala, R.J. (2009). The theory and practice of item response theory. NY: Guilford Press
- DeMars, C. (2010). ıtem response theory. New York: Oxford University Press. Peer-Reviewed Publications.
- Dyehouse, M. A. (2009). A comparison of model-data fit for parametric and nonparametric item response theory models using ordinal level ratings. Yayımlanmamış doktora tezi, Indiana.
- Doğan, N. (2002). Klasik test kuramı ve örtük özellikler kuramının örneklemler bağlamında karşılaştırılması. Yayımlanmamış Doktora Tezi, Hacettepe Üniversitesi, Sosyal Bilimler Enstitüsü, Ankara.
- Emons, W.H.M. (2008). Nonparametric person-fit analysis of Polytomous item scores. Applied Psychological Measurement, 32, 3,p. 224-247. Junker, B. W., & Sijtsma, K. (2001). Nonparametric item response theory in action: an overview of the special issue. Applied Psychological Measurement, 25, 211-220. Han, K. T. (2007). WinGen: Windows software that generates IRT parameters and item responses. Applied Psychological Measurement, 31(5), 457-459. Han, K. T., & Hambleton, R. K. (2007). User's Manual: WinGen (Center for Educational Assessment Report No. 642). Amherst, MA: University of Massachusetts, School of Education.
- Hulin, C.L., Lissak, R.I & Drasgow, F. (1982). Recovery of two and three parameter logistic item characteristic curves: a monte carlo study. Applied Psychological Measurement, 6, 249-260.
Details
Primary Language
English
Subjects
-
Journal Section
Research Article
Publication Date
December 28, 2017
Submission Date
October 13, 2017
Acceptance Date
November 6, 2017
Published in Issue
Year 2017 Volume: 8 Number: 4
Cited By
Farklı Yetenek Dağılımlarında Madde Güçlük Dağılımı, Test Uzunluğu ve Örneklem Büyüklüğünün İncelenmesi
Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi
https://doi.org/10.21031/epod.385000Comparison of G and Phi coefficients estimated in generalizability theory with real cases
International Journal of Assessment Tools in Education
https://doi.org/10.21449/ijate.948677Drawing a Sample with Desired Properties from Population in R Package “drawsample”
Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi
https://doi.org/10.21031/epod.790449Development of a “Perceived Stress Scale" Based on Classical Test Theory and Graded Response Model
International Journal of Assessment Tools in Education
https://doi.org/10.21449/ijate.626053