The aim of this research is to determine the important variables that predict the PISA 2018 reading comprehension achievement score of countries with different achievement levels, using 34 independent variables obtained from the student questionnaire given to the students who participated in PISA in 2018. For this purpose, 79 countries that participated PISA were ranked according to their success percentages then, these countries were sorted into lower, middle and upper group countries. A sample of lower, middle and upper group countries was formed then, three countries were selected from each of the lower group, middle group and upper group countries and a sample of lower, middle and upper group countries was formed. Data mining analyzes were carried out on the samples obtained by using the Classification and Regression Tree and Random Forest methods. It has been observed that the number of important variables that predict reading comprehension success can be reduced from 34 to three to eight. Like this; Data mining classification prediction models, which can predict the success level of PISA, were obtained by using a small number of variables. It has been determined that the models obtained have an acceptable level of predictive performance in predicting success in three categories (low, medium-high). The most important predictor variables obtained from the models are information and communication technologies resources, perception of reading difficulty, professional status expected from the student, perception of difficulty in the PISA test, reading pleasure, weekly test language learning time, disciplinary climate, socio-economic status index.
machine learning data mining prediction performance pisa weka modeler decision trees
Bu araştırmanın amacı, 2018 yılında PISA’ya katılan öğrencilere sınavla birlikte verilen öğrenci anketinden elde edilen 34 bağımsız değişkeni kullanarak, farklı başarı düzeyine sahip ülkelerin PISA 2018 okuduğunu anlama başarı puanını yordayan önemli değişkenleri belirlemektir. Bu amaç için PISA’ya giren 79 ülke başarı yüzdeliklerine göre sıralanmış ve bu sıralamaya göre bu ülkeler alt, orta ve üst grup ülkeler olarak ayrılmıştır. Daha sonra alt grup, orta grup ve üst grup ülkelerin her birinden üçer ülke seçilerek alt, orta ve üst grup ülkeler örneklemi oluşturulmuştur. Elde edilen örneklemler üzerinde Sınıflama ve Regresyon Ağacı ve Rastgele Orman yöntemleri kullanılarak veri madenciliği analizleri gerçekleştirilmiştir. Yapılan uygulamalarda okuduğunu anlama başarısını yordayan önemli değişkenlerin sayısının 34’ten üç ile sekiz arasında bir sayıya indirgenebildiği görülmüştür. Böylece; az sayıda değişken kullanılarak PISA başarı düzeyini yordayabilen veri madenciliği sınıflama tahmin modelleri elde edilmiştir. Elde edilen modellerin başarıyı üç kategorili (düşük, orta yüksek) yordama da kabul edilebilir düzeyde tahmin performansına sahip oldukları saptanmıştır. Modellerden elde edilen tahmin edici değişkenlerden en önemli olanları bilgi iletişim teknolojileri kaynakları, okuma zorluk algısı, öğrenciden beklenen mesleki statü, PISA testinin zorluk algısı, okuma keyfi, haftalık test dili öğrenme süresi, disiplin iklimi, sosyo-ekonomik durum indeksi biçimindedir.
machine learning data mining prediction performance pisa weka modeler decision trees
Birincil Dil | İngilizce |
---|---|
Konular | Türkçe Eğitimi |
Bölüm | Makaleler |
Yazarlar | |
Erken Görünüm Tarihi | 19 Ağustos 2023 |
Yayımlanma Tarihi | 22 Ağustos 2023 |
Yayımlandığı Sayı | Yıl 2023 Cilt: 20 Sayı: 2 |