In recent years, adaptive testing techniques such as Computerized Adaptive Testing (CAT) and Computerized Multistage Testing (MST) have been increasingly incorporated into large-scale evaluations. This study aims to compare Fixed-MST (F-MST) and On-the-Fly MST (O-MST), a novel approach in which items are grouped into modules based on the participant’s ability level, in terms of measurement precision and item security across various simulation scenarios. The simulations were carried out using item parameter distributions derived from the 3PL model applied in TIMSS. A total of 72 different conditions were analyzed to compare O-MST with F-MST. The findings on measurement precision reveal that O-MST performs better than F-MST, especially when the test lengths are shorter, where O-MST shows substantially higher measurement precision. Moreover, when examining ability distributions, O-MST demonstrates better measurement precision compared to F-MST, particularly in cases of non-normal distributions. A significant result from this study is that the measurement precision of O-MST improves as the length of the final module increases, whereas the measurement precision of F-MST becomes more similar to O-MST as the length of the initial module increases. Regarding item security, O-MST employed a greater number of items and exhibited a lower item exposure rate compared to F-MST in all conditions. The favorable results in terms of measurement precision and item security for O-MST are discussed within the framework of large-scale assessments and relevant literature.
Computerized Multistage Testing Adaptive Testing Item Security Item Exposure Rate.
Son yıllarda, Bireyselleştirilmiş Bilgisayarlı Testler (BBT) ve Bireyselleştirilmiş Çok Aşamalı Testler (BÇAT) gibi uyarlanabilir test teknikleri, büyük ölçekli değerlendirmelere giderek daha fazla dahil edilmektedir. Bu çalışmanın amacı, maddelerin katılımcının yetenek düzeyine göre modüller halinde gruplandırıldığı yeni bir yaklaşım olan Sabit-BÇAT (S-BÇAT) ve Anında BÇAT'ı (A-BÇAT) çeşitli simülasyon senaryolarında ölçme kesinliği ve madde güvenliği açısından karşılaştırmaktır. Simülasyonlar, TIMSS'te uygulanan maddelerin 3PL modelinden türetilen madde parametre dağılımları kullanılarak gerçekleştirilmiştir. A-BÇAT ile S-BÇAT'ı karşılaştırmak için toplam 72 farklı koşul analiz edilmiştir. Ölçme kesinliğine ilişkin bulgular, A-BÇAT'ın S-BÇAT'tan daha iyi performans gösterdiğini, özellikle de test uzunlukları daha kısa olduğunda, A-BÇAT'ın önemli ölçüde daha yüksek ölçme kesinliği gösterdiğini ortaya koymaktadır. Ayrıca, yetenek dağılımları incelendiğinde, A-BÇAT, özellikle normal olmayan dağılımlarda S-BÇAT'a kıyasla daha iyi ölçme kesinliği göstermektedir. Bu çalışmadan elde edilen önemli bir sonuç, A-BÇAT'ın ölçme kesinliğinin son modülün uzunluğu arttıkça iyileşmesi, S-BÇAT'ın ölçme kesinliğinin ise başlangıç modülünün uzunluğu arttıkça A-BÇAT'a daha çok benzemesidir. Madde güvenliği ile ilgili olarak, A-BÇAT daha fazla sayıda madde kullanmış ve tüm koşullarda S-BÇAT'a kıyasla daha düşük bir madde maruz kalma oranı sergilemiştir. A-BÇAT için ölçme kesinliği ve madde güvenliği açısından olumlu sonuçlar tartışılmaktadır.
Madde Güvenliği Bireyselleştirilmiş Çok Aşamalı Testler Bilgisayarlı Testler Madde Güvenliği Madde Teşhir Oranı
Bu araştırmada kullanılan veriler bilgisayar programları aracılığıyla belirli koşullar altında model karşılaştırmaları yapmak amacıyla üretilmiştir. Herhangi bir canlı üzerinde uygulama yapılmadığından etik kurul izni alınmasına gerek yoktur. Hacettepe Üniversitesi Etik Beyan Muafiyet formu eklenmiştir.
| Birincil Dil | Türkçe |
|---|---|
| Konular | Bilgisayar Tabanlı Sınav Uygulamaları |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 25 Mart 2025 |
| Kabul Tarihi | 27 Ekim 2025 |
| Yayımlanma Tarihi | 25 Nisan 2026 |
| DOI | https://doi.org/10.24315/tred.1665684 |
| IZ | https://izlik.org/JA63WW33FJ |
| Yayımlandığı Sayı | Yıl 2026 Cilt: 16 Sayı: 2 |