Araştırma Makalesi

Örneklem Büyüklüğünün ve Kayıp Veri Oranının Genellenebilirlik Katsayılarına Etkisi

Cilt: 18 Sayı: 75 20 Mayıs 2018
PDF İndir
TR EN

Örneklem Büyüklüğünün ve Kayıp Veri Oranının Genellenebilirlik Katsayılarına Etkisi

Öz

Problem Durumu: Veri toplama ve bu verilerin analiz edilmesinin temele alındığı araştırmalarda karşılaşılma olasılığı olan en önemli problemlerden biri kayıp veridir. Kayıp veri planlanan veri kümesi ile elde edilen veri kümesi arasındaki fark olarak tanımlanabilir. Alan yazın incelendiğinde kayıp veri problemi ölçme araçlarının uygulanması sonucu karşılaşılan yaygın bir problem olmasına karşın, ölçme

Sumeyra SOYSAL - Haydar KARAMAN – Nuri DOGAN

Eurasian Journal of Educational Research 75 (2018) 179-196

195

araçlarının psikometrik özelliklerine etkisi üzerinde pek durulmamıştır. Özellikle ölçme sonuçlarının güvenirliğinin, geçerliğinin, ortalama ayırıcılık ve güçlük gibi istatistiklerin kayıp verilerden nasıl ve ne düzeyde etkilendiği konusu pek araştırılmamıştır. Başarı testi, tutum ölçeği, anketler vb. katılımcılara uygulandığı zaman çeşitli sebeplerle bazı katılımcıların cevap vermemesi durumuna çok sık rastlanır. Katılımcılar ölçme araçlarındaki soruları bir fikri olmaması, uygun bir cevap bulamaması, yanlışlıkla soruyu cevaplamadan atlaması veya cevabını doğru bir şekilde işaretlememesi nedenleriyle boş bırakabilmektedir. Ancak ölçme araçlarına gelen cevaplar azaldıkça ya da kayıp veri arttıkça toplanan bilgi azalacak ve ölçme sonuçlarının geçerliği ve güvenirliğinin düşmesi beklenecektir. Kayıp verilerin eğitim ve psikolojide kullanılan ölçme araçlarının psikometrik özelliklerini etkilemesi kaçınılmaz bir durumdur. Dolayısıyla kayıp verilerin ölçme araçlarının psikometrik özellikleri üzerindeki etkisinin araştırılmasına ihtiyaç olduğu düşünülmektedir.

Araştırmanın Amacı: Belirlenen bu ihtiyaca bağlı olarak kayıp verinin ölçme araçlarının psikometrik özelliklerinden güvenirliğe etkisi üzerinde çalışılmasına karar verilmiştir. Bu yönü ile çalışma diğer çalışmalardan farklılık göstermektedir. Çalışmanın ikinci ve daha önemli bir yönü ise kayıp veri oranının genellenebilirlik (G) ve phi (güvenirlik) katsayısına olan etkisini incelemesidir. Brennan (2001), Genellenebilirlik kuramına dayalı olarak kayıp veriye sahip ölçme sonuçlarından uygun formüllerle herhangi bir cevaplayıcıyı verilerden silmeden genellenebilirlik ve güvenilirlik katsayılarının hesaplanacağını göstermiş ancak kayıp verinin G ve Phi katsayısına olan etkisi herhangi bir araştırmacı tarafından incelenmemiştir. Kayıp verilerin G ve Phi katsayısına etkisi bu araştırmanın temel sorusunu oluşturmaktadır. Ayrıca ikili puanlanan verilerde kayıp veri sorunu ile karşılaşan araştırmacıların en sık başvurdukları yöntemlerden biri kayıp verileri yanlış cevap olarak kabul edip sıfır puan ataması yapmaktır. Bu yaklaşımın güvenirlik kestirimine etkisi, bu çalışmayla cevaplamaya çalışılan bir başka sorudur. Dolayısıyla, bu araştırmada normal dağılım altında zayıf ve güçlü tek boyutluluk özelliği gösteren kayıp verili ve sıfır atamayla elde edilen ölçme sonuçlarının güvenirliğinin değişen örneklem büyüklüleri ve kayıp veri oranlarından nasıl etkilendiği sorusuna yanıt aranmıştır.

Araştırmanın Yöntemi: Güvenirlik kestirimleri, hata kaynaklarına bağlı olarak farklı anlamlarda elde edilen güvenirlik katsayılarını aynı anda değerlendirmeyi sağlayan Genellenebilirlik Kuramı açısından ele alınmıştır. Araştırma sorularına bağlı olarak öncelikle normal dağılım gösteren zayıf ve güçlü tek boyutlu yapılarda farklı örneklem büyüklüğüne (N=100, 200, 400, 1000) sahip tam veri setleri üretilmiştir. Bu setlerden tamamıyla seçkisiz olacak şekilde farklı kayıp veri oranlarında (%5, %10, %20,%30) veriler silinerek kayıp verili setler oluşturulmuştur. Araştırma sonuçları tam veri setleri ile kayıp ve sıfır atama yapılmış veri matrislerinden elde edilen G ve phi katsayılarının ortalamaları karşılaştırılarak değerlendirilmiştir. Ayrıca değerlendirmeleri daha isabetli yapabilmek için hata istatistiklerinden hataların kareleri ortalamasının karekökü (RMSE) ve yanlılık (bias) değerleri hesaplanarak yorumlanmıştır.

196 Sumeyra SOYSAL - Haydar KARAMAN – Nuri DOGAN

Eurasian Journal of Educational Research 75 (2018) 179-196

Araştırmanın Bulguları: Tam veri ile kayıp veri setlerinden elde edilen kestirimler karşılaştırıldığında, zayıf tek boyutlu desenler için kayıp veri oranının %20 ve daha fazla olduğu durumlarda G ve Phi katsayılarının önemli derecede etkilendiği ancak güçlü tek boyutlu desenler de kayıp veri oranın %30 olduğu durumda dahi bu katsayıların minimal düzeyde etkilendiği bulunmuştur. Örneklem büyüklüğünün her bir koşulu için kayıp veri oranı artıkça hata değerlerinin zayıf tek boyutlu verilerde daha fazla arttığı; güçlü tek boyutlu verilerde ise minimal düzeyde arttığı gözlenmiştir. Kayıp veri oranının her bir koşulu için zayıf ve güçlü tek boyutlu verilerin her ikisinde de örneklem büyüklüğü arttıkça hata ve yanlılık değerlerinin ya değişmediği ya da minimal düzeyde azaldığı görülmüştür. Bütün koşullar bir arada değerlendirildiğinde zayıf tek boyutlu verilere ait hata istatistiklerinin güçlü tek boyutlu verilerden elde edilenlere göre daha büyük olduğu gözlenmiştir. Ayrıca özellikle zayıf tek boyutlu verilerde sıfır atama sonucu elde edilen kestirimlerin kayıp veri matrisinden elde edilen kestirimlerden daha düşük ve sıfır atama yöntemine dayalı olarak zayıf tek boyutlu verilerin hata istatistiklerinin güçlü tek boyutlu verilerin hata istatistiklerinden, özellikle %20 ve %30 kayıp veri oranlarında, önemli derecede yüksek olduğu bulunmuştur.

Araştırmanın Sonuçları ve Önerileri: Dolayısıyla sıfır atama yöntemi ile elde edilen güvenirlik kestirimleri yanlı sonuçlar verdiğinden bu yöntemin güvenirlik kestirimlerinde kayıp veri ile baş etme yöntemi olarak kullanılmaması; bunun yerine ölçme sonuçlarının güvenirliğinin hesaplanmasında kayıp veri matrisleri ile analiz yapmaya olanak sağlayan Genellenebilirlik kuramının kullanılması önerilebilir. Ayrıca kayıp veri matrisleriyle ölçme sonuçlarının güvenirliğinin Genellenebilirlik kuramı ile hesaplanabileceğine dikkat çekmek istenilen bu çalışma iki kategorili veriler ile yürütülmüştür. Mevcut analizler çok kategorili veriler için tekrarlanabileceği gibi araştırmada incelenen koşulların farklı düzeylerinde de gerçekleştirilebilir. Bir başka araştırma problemi olan kayıp veri ile baş etme yöntemlerinin ölçme sonuçlarının güvenirliğine etkisi Genellenebilirlik kuramı bağlamında ayrıca incelenebilir.

Anahtar Kelimeler

Kaynakça

  1. Allison, P. D. (2001). Missing data. Thousands Oaks, CA: Sage Publiation.
  2. Atilgan, H. (2013). Sample size for estimation of G and phi coefficients in generalizability theory. Eurasian Journal of Educational Research, 51, 215-227.
  3. Aydilek, İ. B. (2013). Veri kumelerindeki eksik degerlerin yeni yaklasimlar kullanilarak hesaplanmasi. (Unpublished doctoral dissertation). Selcuk University, Institute Of Science, Konya.
  4. Bakis, R., & Goncu S. (2015). Akarsu debi olcumlerinde eksik verilerin tamamlanmasi: Zap suyu havzasi ornegi [Completion of missing data in rivers flow measurement: case study of zab river basin]. Anadolu University Journal of Science and Technology A - Applied Sciences and Engineering, 16(1), 63–79.
  5. Baraldi, A.N., & Enders, C.K. (2009). An introduction to modern missing data analyses. Journal of School Psychology, 48, 5-37. Brennan, R. L. (2001). Generalizability theory. New York: Springer-Verlag
  6. Cheng, H. (2016). Principle components analysis with missing values and outliers. Retrieved April 19, 2016, from http://citeseerx.ist.psu.edu/viewdoc/versions?doi=10.1.1.4.6605&version=3
  7. Cool, A.L. (2000). A review methods for dealing with missing data. Paper presented annual meeting of the Southwest Educational Research Association, Dallas, January 28, TX.
  8. Cum, S., & Gelbal, S. (2015). Kayip veriler yerine yaklasik deger atamada kullanilan farkli yontemlerin model veri uyumu uzerindeki etkisi [The effects of different methods used for value imputation instead of missing values on model data fit statistics]. Mehmet Akif Ersoy University Journal of Education Faculty, 35, 87-111.

Ayrıntılar

Birincil Dil

İngilizce

Konular

-

Bölüm

Araştırma Makalesi

Yazarlar

Sumeyra Soysal Bu kişi benim

Haydar Karaman Bu kişi benim

Yayımlanma Tarihi

20 Mayıs 2018

Gönderilme Tarihi

20 Mayıs 2018

Kabul Tarihi

-

Yayımlandığı Sayı

Yıl 1970 Cilt: 18 Sayı: 75

Kaynak Göster

APA
Soysal, S., Karaman, H., & Dogan, N. (2018). The Effects of Sample Size and Missing Data Rates on Generalizability Coefficients. Eurasian Journal of Educational Research, 18(75), 179-195. https://izlik.org/JA62NL49UC
AMA
1.Soysal S, Karaman H, Dogan N. The Effects of Sample Size and Missing Data Rates on Generalizability Coefficients. Eurasian Journal of Educational Research. 2018;18(75):179-195. https://izlik.org/JA62NL49UC
Chicago
Soysal, Sumeyra, Haydar Karaman, ve Nuri Dogan. 2018. “The Effects of Sample Size and Missing Data Rates on Generalizability Coefficients”. Eurasian Journal of Educational Research 18 (75): 179-95. https://izlik.org/JA62NL49UC.
EndNote
Soysal S, Karaman H, Dogan N (01 Mayıs 2018) The Effects of Sample Size and Missing Data Rates on Generalizability Coefficients. Eurasian Journal of Educational Research 18 75 179–195.
IEEE
[1]S. Soysal, H. Karaman, ve N. Dogan, “The Effects of Sample Size and Missing Data Rates on Generalizability Coefficients”, Eurasian Journal of Educational Research, c. 18, sy 75, ss. 179–195, May. 2018, [çevrimiçi]. Erişim adresi: https://izlik.org/JA62NL49UC
ISNAD
Soysal, Sumeyra - Karaman, Haydar - Dogan, Nuri. “The Effects of Sample Size and Missing Data Rates on Generalizability Coefficients”. Eurasian Journal of Educational Research 18/75 (01 Mayıs 2018): 179-195. https://izlik.org/JA62NL49UC.
JAMA
1.Soysal S, Karaman H, Dogan N. The Effects of Sample Size and Missing Data Rates on Generalizability Coefficients. Eurasian Journal of Educational Research. 2018;18:179–195.
MLA
Soysal, Sumeyra, vd. “The Effects of Sample Size and Missing Data Rates on Generalizability Coefficients”. Eurasian Journal of Educational Research, c. 18, sy 75, Mayıs 2018, ss. 179-95, https://izlik.org/JA62NL49UC.
Vancouver
1.Sumeyra Soysal, Haydar Karaman, Nuri Dogan. The Effects of Sample Size and Missing Data Rates on Generalizability Coefficients. Eurasian Journal of Educational Research [Internet]. 01 Mayıs 2018;18(75):179-95. Erişim adresi: https://izlik.org/JA62NL49UC