Kayıp Veriler Yerine Yaklaşık Değer Atamada Kullanılan Farklı Yöntemlerin Model Veri Uyumu Üzerindeki Etkisi
Öz
Özet
Bu çalışmanın genel amacı, farklı oranlarda ve farklı örüntü yapılarında kayıp veri içeren veri setleri üzerinde, farklı yöntemler kullanılarak yürütülen değer atamalarının, örtük değişkenlerle oluşturulan bir yapısal eşitlik modelinden elde edilen model veri uyum değerleri üzerindeki etkilerinin karşılaştırmalı olarak incelenmesidir. Bu amaç doğrultusunda çalışma, PISA 2012’ye Türkiye’den katılan 15 yaş grubundaki 4848 öğrenci arasından seçilen 1578 öğrenciden elde edilen puanların oluşturduğu veri seti üzerinde yürütülmüştür. Tam veri seti üzerinden eksiltmeler yapılarak tamamıyla rastlantısal olarak dağılan yaklaşık %20 ve %30 oranlarında ve tamamıyla rastlantısal olarak dağılmayan yaklaşık %20 oranında kayıp verilerin oluşturulduğu çalışmada, 10 farklı yöntemle yapılan yaklaşık değer atamalarının model veri uyum değerlerini nasıl etkilediği incelenmiştir. Kayıp verilerin tamamıyla rastlantısal olarak dağıldığı durumlarda regresyonla atama yöntemi sonrası elde edilen veri yapısının modele uyum değerlerinin tam veri setinin modele uyum değerlerine en yakın değerler olduğu sonucuna ulaşılmıştır. Tamamıyla rastlantısal olarak dağılmayan kayıp verilerin bulunması durumunda ise bayesci veri atama ve stokastik regresyonla atama yöntemleri ile yapılan değer atamalarıyla tam veri setinin modele uyum değerlerine en yakın değerlerin elde edildiği belirlenmiştir. Çalışmada ayrıca, kayıp veriler yerine yaklaşık değer atama yöntemlerinin veri dağılımlarını önemli ölçüde değiştirdiği belirlenmiş ve bilinçsizce yapılan atamaların daha sonra yapılacak olan analizlerin sonuçlarını araştırmacıları yanıltacak şekilde etkileyebileceği sonucuna ulaşılmıştır.
Anahtar Kelimeler: Kayıp Veri Analizi, Değer Atama Yöntemleri, Yapısal Eşitlik Modeli, Uyum İyiliği
Anahtar Kelimeler
Kaynakça
- and effect size. Retrieved on 06. 01. 2015, at URL:
- http://scholarworks.gsu.edu/eps_diss/35
- Köse, İ. A. (2014). The effect of missing data handling methods on goodness of fit indices in confirmatory factor analysis. Educational Resarch and Reviews, 9(8), 208-215.
- Köse, İ. A. ve Öztemur, B. (2014). Kayıp veri ele alma yöntemlerinin t-testi ve ANOVA parametreleri üzerine etkisinin incelenmesi. Abant İzzet Baysal Eğitim Fakültesi Dergisi, 14(1), 400-412.
- Little, R. ve Rubin, D. (1987). Statistical analysis with missing data. New York: Wiley.
- OECD (2014). PISA 2012 technical report. Retrieved on 06. 01. 2015, at URL: http://www.oecd.org/pisa/pisaproducts/PISA-2012-technical-report-final.pdf
- Osborne, J. W. (2013). Best practices in data cleaning. California: Sage Publication, Inc.
- Pigott, T. D. (2001). A review of methods for missing data. Educational Resarch and Evaluation, 7(1), 353-383.
Ayrıntılar
Birincil Dil
Türkçe
Konular
-
Bölüm
-
Yayımlanma Tarihi
30 Eylül 2015
Gönderilme Tarihi
14 Mart 2015
Kabul Tarihi
-
Yayımlandığı Sayı
Yıl 2015 Cilt: 1 Sayı: 35