Bu çalışmada, PISA 2018 verileri kullanılarak, Türkiye, Bulgaristan, Meksika ve Tayland'daki öğrencilerin başarılarını etkileyen faktörlerin, öğrenci üzerindeki etkisinin tespitinde çeşitli makine öğrenimi modellerinin etkinliği karşılaştırılmıştır. Çalışmada regresyon için; doğrusal regresyon, destek vektör makinesi, karar ağacı ve rastgele orman, sınıflandırma için; lojistik regresyon, destek vektör makinesi, karar ağacı ve rastgele orman modelleri kullanılmıştır. Ayrıca, XGBoost matematik başarısının temel belirleyicileri tanımlanmış ve K-Means kümeleme ile eksik verileri doldurulmuştur. Sonuçlara göre, tüm ülkeler için, öğrencilerin ekonomik ve sosyokültürel durumları, evdeki çalışma materyalleri, sorumluluk duyguları ve ailelerinin ilgisi temel katkı faktörlerini oluşturmaktadır. Model başarısı açısından, rastgele orman modeli hem regresyon hem de sınıflandırmada diğer modellere göre daha başarılı olmuş, rastgele orman regresyonu en yüksek R-kare değerlerini (%71-%84) elde etmiştir, doğrusal regresyon ise en düşük değerleri (%22-%43) vermiştir. Buna ek olarak, sınıflandırma algoritmaları ikili ve üçlü sınıflandırma açısından da analiz edilmiş, ikili sınıflandırmanın üçlü sınıflandırmadan daha başarılı olduğu gözlemlenmiştir. Rastgele orman algoritmasının doğruluk skorları ülkeler arasında %73 ile %83 arasında değişmiştir. Çalışmanın bulguları, öğrencinin matematik başarısına etki eden faktörleri tahmin etmek için en uygun algoritmaların seçiminde, karar vericiler için değerli içgörüler sunmakta ve eğitim sonuçlarını iyileştirmeleri için karar vericilere yardımcı olmaktadır.
Yüksek Lisans Tezi özeti olarak sunduğum "A Comparative Analysis of Machine Learning Techniques to Explore Factors Affecting Mathematics Success in Developing Countries: Turkey, Mexico, Thailand, And Bulgaria Case Studies " başlıklı makalenin yazılmasında bilimsel ve etik kurallara uyulduğunu, başvurulan kaynaklardan yapılan alıntılarının adlarının bilimsel kurallara uygun olarak metin içinde, dipnotlarda ve kaynaklarda gösterildiğini, kullanılan verilerde herhangi bir tahrifat yapılmadığını beyan ederim.
Kadir Has Üniversitesi
Tez danışmanım, kıymetli hocam Sn. Mahmut Çavur'a her türlü desteği ve bilgiyi verdiği için teşekkürlerimi sunarım.
This study explores factors influencing mathematics achievement in Turkey, Bulgaria, Mexico, and Thailand using PISA 2018 data and machine learning models, comparing their performance. Both classification and regression models were utilized: linear regression, support vector machine, decision tree, and random forest for regression; logistic regression, support vector, decision tree, and random forest for classification. Additionally, XGBoost identified key predictors of math achievement, and K-Means filled missing data. According to results, key contributing factors across all countries included students' economic, social, and cultural status, study materials at home, sense of ownership, and family welfare. Regarding model success, random forests outperformed other models in both regression and classification, with Random Forest Regression achieving the highest R-square values (71%-84%) while linear regression has the lowest (22%-43%). In addition, the classification algorithms were analyzed in terms of binary and ternary classification, binary classification proved more successful than ternary, with RF accuracy scores ranging from 73% to 83% across countries. The study's findings offer valuable insights for selecting optimal algorithms for predicting math achievement, aiding decision-makers in enhancing educational outcomes.
Primary Language | English |
---|---|
Subjects | Management Information Systems, Data Engineering and Data Science, Data Management and Data Science (Other), Reinforcement Learning |
Journal Section | Vol 6 - Issue 2 - 30 December 2024 [en] |
Authors | |
Publication Date | December 30, 2024 |
Submission Date | July 13, 2024 |
Acceptance Date | December 21, 2024 |
Published in Issue | Year 2024 Volume: 6 Issue: 2 |