Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması

Merve Şahin Kürşad; Zekeriya Nartgün

doi:10.21031/epod.95917

Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması

Year 2015, Volume: 6 Issue: 2, 0 - 0, 02.01.2016

Merve Şahin Kürşad , Zekeriya Nartgün

https://doi.org/10.21031/epod.95917

Cited By: 10

Abstract

Bu araştırmanın amacı kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin etkililiğini ölçeklerin geçerliği ve güvenirliği bağlamında karşılaştırmaktır. Bu amaçla, PISA 2012 Türkiye örneklemi ve “Matematik Çalışma Etiği” ölçeğinden yararlanılmıştır. Analizler için Türkiye örnekleminden rastgele 200 kişilik tam veri seti çekilmiştir. Tam veri setinden, tamamıyla rassal olarak kayıp (TROK) mekanizması altında, farklı oranlarda veri silme ve bu verileri farklı kayıp veri yöntemleriyle yeni tam veri setlerine dönüştürme işlemlerinden sonra geçerlik ve güvenirliğe ilişkin analizler gerçekleştirilmiştir. Kayıp veri içeren setlerin yeni tam veri setlerine dönüştürülmesinde seri ortalaması, yakın noktaların ortalaması, yakın noktaların medyanı, doğrusal değer kestirimi, noktanın doğrusal eğimi, liste bazında silme, beklenti maksimizasyonu, regresyon ataması ve çoklu atama kayıp veri yöntemleri kullanılmıştır. Yeni tam veri setlerinden geçerlik ve güvenirliğe ilişkin elde edilen değerleri karşılaştırarak yorumlamada tam veri setinden elde edilen değerler referans değerler olarak kullanılmıştır. Araştırma sonuçlarına göre liste bazında silme yöntemi için elde edilen değerler, genel olarak tam veri setinden elde edilen değerlere en az benzerlik gösteren değerler olmuştur. Yaklaşık değer atama yöntemleri için elde edilen değerler kayıp veri oranının düşük olduğu durumlarda genel olarak tam veri setinden elde edilen değerlere yakın veya aynı değerleri verirken, tüm kayıp veri oranları için tam veri setinden elde edilen değerlere en yakın değer veren yöntemler çoklu atama, beklenti maksimizasyonu ve regresyon ataması yöntemleri olmuştur.

References

Akhun, İ. (1994). İstatistiksel formüller ve tablolar. (4.Baskı). Ankara: Hacettepe Üniversitesi, Eğitim Faültesi
Allison, P.D. (2003). Missing data techniques for structural equation modeling. Journal of Abnormal Psychology, 112 (4), 545-557, DOI: 10.1037/0021-843X.112.4.545.
Allison, P.D. (2009). Missing data. Sage University Paper Series on Quantitative Applications in the Social Sciences, 72-89. London: Sage Publication.
Bal, C. (2003). Çok gruplu veri setlerinde eksik gözlem sorununun çözümlenmesi ve sağlık alanında bir uygulama. Yayımlanmamış Doktora Tezi, Osmangazi Üniversitesi, Sağlık Bilimleri Enstitüsü, Eskişehir.
Bernaards, C.A. ve Sijtsma, K. (2000). Influence of imputation and EM methods on factor analysis when item nonresponse in questionnaire data is nonignorable. Multivariate Behavioral Research, 35(3), 321-364, DOI: 10.1207/S15327906MBR3503_03.
Brown, M.L. ve Kros, J. F. (2003). Data mining and the impact of missing data. Industrial Management & Data System, 103 (8), 611- 621, DOI: 10.1108/02635570310497657.
Buhi, E.R., Goodson, P. ve Neilands, T.B. (2008). Out of sight, not out of mind: Strategies for handling missing data. American Journal of Health Behavior, 32 (1), 83-92.
Büyüköztürk, Ş. (2007). Sosyal bilim için veri analizi el kitabı (7.Baskı). Ankara: Pegem Akademi.
Carpita, M. ve Manisera, M. (2011). On the imputation of missing data in surveys with likert- type scales. Journal of Classical, 28, 93-112, DOI: 10.1007/s00357-011-9074-z
Cheema, J. (2012). Handling missing data in educational research using SPSS. Unpublished doctoral dissertation, George Mason University, USA.
Chen, S.F., Wang, S. ve Chen, Y.C. (2012). A simulation study using EFA and CFA programs based the impact of missing data on test dimensionality. Expert Systems with Applications, 39, 4026–4031.
Cumming, P. (2013). Missing data and multiple imputation. Clinical Review & Education, 167 (7), 656-661.
Çokluk, Ö. ve Kayri, M. (2011). Kayıp değerlere yaklaşık değer atama yöntemlerinin ölçme araçlarının geçerlik ve güvenirliği üzerindeki etkisi. Kuram ve Uygulamada Eğitim Bilimleri, 11 (1), 289-309.
Demir, E. ve Parlak, B. (2012). Türkiye’de eğitim araştırmalarında kayıp veri sorunu. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 3 (1), 230-241.
Demir, E. (2013). Kayıp verilerin varlığında çoktan seçmeli testlerde madde ve test parametrelerinin kestirilmesi: SBS örneği. Eğitim Bilimleri Araştırmaları Dergisi, 3 (2), 47-68.
Downey, R.G. ve King, C.V. (1998). Missing Data in Likert Ratings: A Comparison of Replacement Methods. The Journal of General Psychology, 125 (2), 175-191, DOI:10.1080/00221309809595542.
Duncan, T.E., Duncan, S.C. ve Li, F. (1998). A comparison of model‐ and multiple imputation‐based approaches to longitudinal analyses with partial missingness. Structural Equation Modeling: A Multidisciplinary Journal, 5 (1), 1-21, DOI: 10.1080/10705519809540086.
Enders, C.K. (2001). A primer on maximum likelihood algorithms available for use with missng data. Structural Equation Modeling, 8 (1), 128-141, DOI: 10.1207/S15328007SEM0801_7.
Enders, C.K. (2004). The impact of missing data on sample reliability estimates: Implications for reliability reporting practices. Educational and Psychological Measurement, 64(3), 419-436, DOI: 10.1177/0013164403261050.
Enders, C.K. (2013). Dealing with missing data in developmental research. Child Development Perspectives, 7 (1), 27- 31.
Field, A. (2009). Discovering statistics using SPSS (3. Edition). London: Sage Publication.
Finch, H., ve Margraf, M. (2008). Imputation of categorical missing data: A Comparison of multivariate normal and multinomial methods. 20.11.2014 tarihinde http://www.mwsug.org/proceedings/2008/stats/MWSUG-2008-S05.pdf adresinden alınmıştır.
Ginkel, J.R.V., Van der Ark, L.A., Sijtma, K. ve Vermunt, J.K. (2007). Two-way imputation: A Bayesian method for estimating missing scores in tests and questionnaires, and an accurate approximation. Computational Statistics & Data Analysis, 51, 4013 – 4027, DOI:10.1016/j.csda.2006.12.022.
Ginkel, J.R.V., Sijtma, K., Van der Ark, L.A. ve Vermunt, J.K. (2010). Incidence of missing item scores in personality measurement, and simple item-score imputation. Methodology, 6 (1), 17-30, DOI: 10.1027/1614-2241/a000003
Graham, J.W., Hofer, S.M. ve Piccinin, A.M.(1994). Analysis with missing data in drug prevention research. Collins, L.M. ve Seitz, L.A. (eds.). Advances in data analysis for prevention intervention research (ss. 13- 64) içinde. National Institutes of Health.
Graham, J.W. (2009). Missing data analysis: Making it work in the real World. Annual Review of Psychology, 60, 549-576.
Granberg- Rademacker, J.S. (2007). A comparison of three approaches to handling incomplete state level data. State Politics and Policy Quarterly, 7(3), 325-338.
Hohensinn, C. ve Kubinger, K.D. (2011). On the impact of missing values on the item fit and the model validness of the Rasch model. Psychological Test and Assessment Modeling, 53 (3), 380-393.
Huck, S.W. (2012). Reading statistics and research (6.Edition). USA: Pearson.
Karasar, N. (2007). Bilimsel araştırma yöntemi: kavramlar, ilkeler, teknikler. (17. Baskı). Ankara: Nobel Yayın Dağıtım.
Kenny, D.A. (1987). Statistics for the social and behavioral science. USA.
Leite, W. ve Beretvas, S.N. (2010). The performance of multiple imputation for likert-type items with missing data. Journal of Modern Applied Statistical Methods (9)1, 64-74.
Little, R.J.A. (1988). Missing data adjustments in large surveys. Journal of Business & Economic Statistics, 6 (3), 287-296.
McKnight, P.E., McKnight, K.M., Sidani, S. ve Figueredo, A.J (2007). Missing data: A gentle introduction. United States of America: The Guilford Press.
Musil,C.M., Warner, C.B, Yobas, P.K. ve Jones, S.L. (2002). A comparison of imputation techniques for handling missing data. Western Journal of Nursing Research, 24(7),815-829, DOI: 10.1177/019394502237390.
Oğuzlar, A. (2001, Eylül). Alan araştirmalarinda kayıp değer problemi ve çözüm önerileri. V. Ulusal Ekonometri ve İstatistik Sempozyumu’nda sunulan bildiri. Çukurova Üniversitesi, Adana.
Peng, C.-Y. J., Harwell, M., Liou, S.-M ve Ehman L. H. (2006). Advances in missing data methods and implications for educational research. In S. Sawilowsky (ed.), Real data analysis (ss.31-78) içinde. Greenwich, CT: Information Age Publishing Inc.
Satıcı, E. ve Kadılar, C. (2009). Kayıp gözlem olduğunda kitle ortalamasının tahmini. Anadolu Üniversitesi Bilim ve Teknoloji Dergisi, 10 (2), 549-556.
Streiner, D.V. (2002). The case of the missing data: Methods of dealing with dropouts and other research vagaries. Research methods in Psychiatry, 47, 68-75.
Van der Ark, L. A. ve Vermunt, J. K. (2010). New developments in missing data analysis. Methodology, 6 (1), 1-2, DOI: 10.1027/1614-2241/a000001
Vansteelandt, S., Carpenter, J. ve Kenward, M.G. (2010). Analysis of incomplete data using inverse probability weighting and doubly robust estimators. Methodology, 6 (1), 37-48. DOI: 10.1027/1614-2241/a000005.
Yılmaz, H. (2014). Random forests yönteminde kayıp veri probleminin incelenmesi ve sağlık alanında bir uygulama. Yayımlanmamış Yüksek Lisans Tezi, Eskişehir Osmangazi Üniversitesi, Sağlık Bilimleri Enstitüsü, Eskişehir.
Young, W., Weckman, G. ve Holland, W. (2011) A survey of methodologies for the treatment of missing values within datasets: limitations and benefits, Theoretical Issues in Ergonomics Science, 12 (1), 15-43, DOI: 10.1080/14639220903470205

There are 43 citations in total.

Details

Journal Section	Articles
Authors	Merve Şahin Kürşad Zekeriya Nartgün
Publication Date	January 2, 2016
Published in Issue	Year 2015 Volume: 6 Issue: 2

Cite

APA	Şahin Kürşad, M., & Nartgün, Z. (2016). Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması. Journal of Measurement and Evaluation in Education and Psychology, 6(2). https://doi.org/10.21031/epod.95917