SABİT VE ANINDA BİREYSELLEŞTİRİLMİŞ ÇOK AŞAMALI TESTLERİN KARŞILAŞTIRMALI İNCELENMESİ: ÖLÇME KESİNLİĞİ VE MADDE GÜVENLİĞİNE İLİŞKİN ÇIKARIMLAR
Abstract
Son yıllarda, Bireyselleştirilmiş Bilgisayarlı Testler (BBT) ve Bireyselleştirilmiş Çok Aşamalı Testler (BÇAT) gibi uyarlanabilir test teknikleri, büyük ölçekli değerlendirmelere giderek daha fazla dahil edilmektedir. Bu çalışmanın amacı, maddelerin katılımcının yetenek düzeyine göre modüller halinde gruplandırıldığı yeni bir yaklaşım olan Sabit-BÇAT (S-BÇAT) ve Anında BÇAT'ı (A-BÇAT) çeşitli simülasyon senaryolarında ölçme kesinliği ve madde güvenliği açısından karşılaştırmaktır. Simülasyonlar, TIMSS'te uygulanan maddelerin 3PL modelinden türetilen madde parametre dağılımları kullanılarak gerçekleştirilmiştir. A-BÇAT ile S-BÇAT'ı karşılaştırmak için toplam 72 farklı koşul analiz edilmiştir. Ölçme kesinliğine ilişkin bulgular, A-BÇAT'ın S-BÇAT'tan daha iyi performans gösterdiğini, özellikle de test uzunlukları daha kısa olduğunda, A-BÇAT'ın önemli ölçüde daha yüksek ölçme kesinliği gösterdiğini ortaya koymaktadır. Ayrıca, yetenek dağılımları incelendiğinde, A-BÇAT, özellikle normal olmayan dağılımlarda S-BÇAT'a kıyasla daha iyi ölçme kesinliği göstermektedir. Bu çalışmadan elde edilen önemli bir sonuç, A-BÇAT'ın ölçme kesinliğinin son modülün uzunluğu arttıkça iyileşmesi, S-BÇAT'ın ölçme kesinliğinin ise başlangıç modülünün uzunluğu arttıkça A-BÇAT'a daha çok benzemesidir. Madde güvenliği ile ilgili olarak, A-BÇAT daha fazla sayıda madde kullanmış ve tüm koşullarda S-BÇAT'a kıyasla daha düşük bir madde maruz kalma oranı sergilemiştir. A-BÇAT için ölçme kesinliği ve madde güvenliği açısından olumlu sonuçlar tartışılmaktadır.
Keywords
Ethical Statement
References
- Arvey, R. D., Strickland, W., Drauden, G., & Martin, C. (1990). Motivational components of test taking. Personnel Psychology, 43(4), 695–716. https://doi.org/10.1111/j.1744-6570.1990.tb00679.x
- Bergstrom, B. A., Lunz, M. E., & Gershon, R. C. (1992). Altering the level of difficulty in computer adaptive testing. Applied Measurement in Education, 5(2), 137–149. https://doi.org/10.1207/s15324818ame0502_4
- Boztunç Öztürk, N. (2019). How the length and characteristics of routing module affect ability estimation in ca-MST? Universal Journal of Educational Research, 7(1), 164–170. https://doi.org/10.13189/ujer.2019.070121
- Breithaupt, K. J., Mills, C. N., & Melican, G. J. (2006). Facing the opportunities of the future. Computer-based testing and the Internet: Issues and advances, 219-251.
- Bulut, O. (2021). Beyond multiple-choice with digital assessments. ELearn, 2021(Special Issue), 1–10. https://doi.org/10.1145/3472394
- Bulut, O., & Sünbül, Ö. (2017). R Programlama Dili ile Madde Tepki Kuramında Monte Carlo Simülasyon Çalışmaları. Egitimde ve Psikolojide Olcme ve Degerlendirme Dergisi, 8(3), 266–287. https://doi.org/10.21031/epod.305821
- Cai, L., Albano, A. D., & Roussos, L. A. (2021). An investigation of item calibration methods in multistage testing. Measurement: Interdisciplinary Research and Perspectives, 19(3), 163–178. https://doi.org/10.1080/15366367.2021.1878778
- Carlson, S. (2000). ETS finds flaws in the way online GRE rates some students. Chronicle of Higher Education, 47(8), A47.
Details
Primary Language
Turkish
Subjects
Computer Based Exam Applications
Journal Section
Research Article
Publication Date
April 25, 2026
Submission Date
March 25, 2025
Acceptance Date
October 27, 2025
Published in Issue
Year 2026 Volume: 16 Number: 2