Research Article
BibTex RIS Cite

Makine Öğrenimi ve Beta Regresyon Modelleri Kullanılarak Lise Giriş Sınavı Başarı Oranlarının Tahmini

Year 2022, Volume: 5 Issue: 1, 9 - 15, 02.03.2022
https://doi.org/10.38016/jista.922663

Abstract

Eğitim, her birey ve bir bütün olarak toplum için ekonomik, sosyal ve kültürel gelişimin temelidir. Ülkemizde orta öğretim kurumlarına Milli Eğitim Bakanlığı tarafından yapılan lise giriş sınavı ile öğrenci kabul edilmektedir. Bu çalışmada, 2019 yılında Türkiye'nin 81 ilinde lise giriş sınavına giren öğrencilerin başarı oranları makine öğrenimi regresyon ve beta regresyon modeli ile ele alınmıştır. Bu makale, boşanma oranı, gayri safi yurtiçi hasıla, okuma yazma bilmeyenlerin sayısı ve yüksek öğretim nüfusu sayısı gibi değişkenleri kullanarak öğrencilerin başarı oranlarını modellemeyi, tahmin etmeyi ve açıklamayı amaçlamaktadır. Başarı oranlarını tahmin etmek için destek vektörü regresyon, rastgele orman, karar ağacı ve beta regresyon modeli uygulanmıştır. En yüksek R2 değerine sahip iki modelin beta regresyon ve rastgele orman modelleri olduğu bulunmuştur. Beta regresyon ve rastgele orman modelinin tahmin hataları incelendiğinde, başarı oranlarını tahmin etmede rastgele orman modelinin beta regresyon modeline göre nispeten üstün olduğu görülmektedir. Beta regresyon modeli Çanakkale ilinin başarı oranlarının en iyi yordayıcısı iken, rastgele orman modeli Ankara'nın başarı oranlarını iyi tahmin etmiştir. Ayrıca beta regresyon modelinde başarı oranları için anlamlı bulunan değişkenlerin rastgele orman modelinde de önemli olduğu görülmüştür. Öğrencilerin başarı oranlarını tahmin etmek için hem beta hem de rastgele orman modellerinin kullanılması önerilir.

References

  • Abbasoğlu, B., 2020. Ortaokul Öğrencilerinin Akademik Başarılarının Eğitsel Veri Madenciliği Yöntemleri İle Tahmini. Veri Bilimi, 3(1), 1-10.
  • Abidi, S. M. R., Hussain, M., Xu, Y. L., & Zhang, W., 2019. Prediction of Confusion Attempting Algebra Homework in an Intelligent Tutoring System through Machine Learning Techniques for Educational Sustainable Development. Sustainability, 11(1), 105. doi:ARTN 105 10.3390/su11010105
  • Al Mayahi, K. and Al-Bahri, M., 2020. Machine Learning Based Predicting Student Academic Success. Paper presented at the 2020 12th International Congress on Ultra Modern Telecommunications and Control Systems and Workshops (ICUMT).
  • Breiman, L., Friedman, J., Olshen, R., & Stone, C., 1998. CART. In: Chapman and Hall/CRC. Cepeda-Cuervo, E., 2015. Beta regression models: Joint mean and variance modeling. Journal of Statistical Theory and Practice, 9(1), 134-145.
  • Çömlekcioğulları, A. (2020). Öğrenci başarısı ile ailelerin sosyo-ekonomik düzeyleri arasındaki ilişki (Denizli ili örneği).
  • Dünder, E., & Cengiz, M. A., 2020. Model selection in beta regression analysis using several information criteria and heuristic optimization. Journal of New Theory(33), 76-84.
  • Ferrari, S. L. P., & Cribari-Neto, F., 2004. Beta regression for modelling rates and proportions. Journal of applied statistics, 31(7), 799-815. doi:10.1080/0266476042000214501
  • Friedman, C., & Sandow, S., 2011. Utility-based learning from data. Boca Raton: Chapman & Hall/CRC. Gök, M., 2017. Makine öğrenmesi yöntemleri ile akademik başarının tahmin edilmesi. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji, 5(3), 139-148.
  • Gunn, S. R., 1998. Support vector machines for Classification and regression. ISIS technical report, 14(1), 5-16.
  • Gür, B., Çelik, Z., & Coşkun, İ., 2013. Türkiye’de ortaöğretimin geleceği: Hiyerarşi mi eşitlik mi. Seta analiz, 69, 1-26.
  • Han, H., Wang, W.-Y., & Mao, B.-H., 2005. Borderline-SMOTE: a new over-sampling method in imbalanced data sets learning. Paper presented at the International conference on intelligent computing.
  • Kikawa, C. R., Ngungu, M. N., Ntirampeba, D., & Ssematimba, A. (2020). Support vector regression and beta distribution for modeling incumbent party for presidential elections. Appl. Math, 14(4), 721-727.
  • Koç, T., 2019. Türkiye’de boşanma oranlarini etkileyen faktörlerin beta regresyon modeli ile belirlenmesi. Avrasya Uluslararası Araştırmalar Dergisi, 7(16), 1111-1117.
  • Kotsiantis, S. B., 2011. Decision trees: a recent overview. Artificial Intelligence Review, 39(4), 261-283. doi:10.1007/s10462-011-9272-4
  • Liaw, A., & Wiener, M., 2002. Classification and regression by randomForest. R news, 2(3), 18-22. MEB. ,2018). 2018 yılı performans programı Ankara Retrieved from sgb.meb.gov.tr.
  • Oral, I., & McGivney, E. J. ,2014. Türkiye eğitim sisteminde eşitlik ve akademik başarı, araştırma raporu ve analiz. İstanbul: Sabancı Üniversitesi Yayınları.
  • Özeren, E., Çiloğlu, T., Yilmaz, R., & Özeren, A. (2020). Öğrencilerin akademik kariyer hedefi seçiminde etkili olan faktörlerin veri madenciliği yöntemi ile belirlenmesi: Bartın başarı takip araştırması sonuçları üzerine bir inceleme. Bilgi ve İletişim Teknolojileri Dergisi, 2(2), 182-210.
  • Rajak, A., Shrivastava, A. K., & Vidushi. ,2020. Applying and comparing machine learning classification algorithms for predicting the results of students. Journal of Discrete Mathematical Sciences & Cryptography, 23(2, 419-427. doi:10.1080/09720529.2020.1728895
  • Rebai, S., Ben Yahia, F., & Essid, H. ,2020. A graphically based machine learning approach to predict secondary schools performance in Tunisia. Socio-Economic Planning Sciences, 70, 100724. doi:ARTN 100724 10.1016/j.seps.2019.06.009
  • Sethi, K., Jaiswal, V., & Ansari, M. D. ,2020. Machine learning based support system for students to select stream ,subject). Recent Advances in Computer Science and Communications ,Formerly: Recent Patents on Computer Science), 13(3), 336-344.
  • Shokry, A., Audino, F., Vicente, P., Escudero, G., Moya, M. P., Graells, M., & Espuña, A. ,2015. Modeling and simulation of complex nonlinear dynamic processes using data-based models: Application to photo-Fenton process. In Computer Aided Chemical Engineering (Vol. 37, pp. 191-196): Elsevier.
  • Therneau, T. M., & Atkinson, E. J. ,1997. An introduction to recursive partitioning using the RPART routines. Retrieved from
  • Uğuz, S. ,2019. Makine Öğrenmesi Teorik Yönleri ve Python Uygulamaları ile Bir Yapay Zeka Ekolü. Ankara: Nobel.
  • Uskov, V. L., Bakken, J. P., Byerly, A., & Shah, A. ,2019. Machine learning-based predictive analytics of student academic performance in STEM education. Paper presented at the 2019 IEEE Global Engineering Education Conference (EDUCON).
  • Vapnik, V. ,1992. Principles of risk minimization for learning theory. Paper presented at the Advances in Neural Information Processing Systems.
  • Yavuz, A., 2020. Ortaöğretime geçiş sınavında öğrenci başarısını etkileyen etmenler.
  • Yousafzai, B. K., Hayat, M., & Afzal, S. , 2020. Application of machine learning and data mining in predicting the performance of intermediate and secondary education level student. Education and Information Technologies, 25(6), 4677-4697. doi:10.1007/s10639-020-10189-1

Estimation of High School Entrance Examination Success Rates Using Machine Learning and Beta Regression Models

Year 2022, Volume: 5 Issue: 1, 9 - 15, 02.03.2022
https://doi.org/10.38016/jista.922663

Abstract

Education is the foundation of economic, social, and cultural development for every individual and society as a whole. Students are accepted to secondary education institutions with the high school entrance examination made by the Ministry of National Education in Turkey. In this study, the success rates of the students who took the high school entrance examination in Turkey's 81 provinces in 2019 were handled with the machine learning regression and beta regression model. The present paper aimed to model, predict, and explain students' success rates using variables such as divorce rate, gross domestic product, illiteracy, and higher education populations. Support vector regression, random forest, decision tree, and beta regression model were applied to estimate success rates. Two models with the highest R2 value were found to be beta regression and random forest models. When the prediction errors of beta regression and random forest model were examined, it seemed to be that the random forest model is relatively superior to the beta regression model in predicting the success rates. While the beta regression model was the best predictor of the success rates of Çanakkale province, the random forest model predicted the success rates of Ankara well. Also, it was seen that the variables found to be significant in the beta regression model for success rates were also crucial in the random forest model. It is recommended to use both the beta and random forest models to estimate the students' success rates.

References

  • Abbasoğlu, B., 2020. Ortaokul Öğrencilerinin Akademik Başarılarının Eğitsel Veri Madenciliği Yöntemleri İle Tahmini. Veri Bilimi, 3(1), 1-10.
  • Abidi, S. M. R., Hussain, M., Xu, Y. L., & Zhang, W., 2019. Prediction of Confusion Attempting Algebra Homework in an Intelligent Tutoring System through Machine Learning Techniques for Educational Sustainable Development. Sustainability, 11(1), 105. doi:ARTN 105 10.3390/su11010105
  • Al Mayahi, K. and Al-Bahri, M., 2020. Machine Learning Based Predicting Student Academic Success. Paper presented at the 2020 12th International Congress on Ultra Modern Telecommunications and Control Systems and Workshops (ICUMT).
  • Breiman, L., Friedman, J., Olshen, R., & Stone, C., 1998. CART. In: Chapman and Hall/CRC. Cepeda-Cuervo, E., 2015. Beta regression models: Joint mean and variance modeling. Journal of Statistical Theory and Practice, 9(1), 134-145.
  • Çömlekcioğulları, A. (2020). Öğrenci başarısı ile ailelerin sosyo-ekonomik düzeyleri arasındaki ilişki (Denizli ili örneği).
  • Dünder, E., & Cengiz, M. A., 2020. Model selection in beta regression analysis using several information criteria and heuristic optimization. Journal of New Theory(33), 76-84.
  • Ferrari, S. L. P., & Cribari-Neto, F., 2004. Beta regression for modelling rates and proportions. Journal of applied statistics, 31(7), 799-815. doi:10.1080/0266476042000214501
  • Friedman, C., & Sandow, S., 2011. Utility-based learning from data. Boca Raton: Chapman & Hall/CRC. Gök, M., 2017. Makine öğrenmesi yöntemleri ile akademik başarının tahmin edilmesi. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji, 5(3), 139-148.
  • Gunn, S. R., 1998. Support vector machines for Classification and regression. ISIS technical report, 14(1), 5-16.
  • Gür, B., Çelik, Z., & Coşkun, İ., 2013. Türkiye’de ortaöğretimin geleceği: Hiyerarşi mi eşitlik mi. Seta analiz, 69, 1-26.
  • Han, H., Wang, W.-Y., & Mao, B.-H., 2005. Borderline-SMOTE: a new over-sampling method in imbalanced data sets learning. Paper presented at the International conference on intelligent computing.
  • Kikawa, C. R., Ngungu, M. N., Ntirampeba, D., & Ssematimba, A. (2020). Support vector regression and beta distribution for modeling incumbent party for presidential elections. Appl. Math, 14(4), 721-727.
  • Koç, T., 2019. Türkiye’de boşanma oranlarini etkileyen faktörlerin beta regresyon modeli ile belirlenmesi. Avrasya Uluslararası Araştırmalar Dergisi, 7(16), 1111-1117.
  • Kotsiantis, S. B., 2011. Decision trees: a recent overview. Artificial Intelligence Review, 39(4), 261-283. doi:10.1007/s10462-011-9272-4
  • Liaw, A., & Wiener, M., 2002. Classification and regression by randomForest. R news, 2(3), 18-22. MEB. ,2018). 2018 yılı performans programı Ankara Retrieved from sgb.meb.gov.tr.
  • Oral, I., & McGivney, E. J. ,2014. Türkiye eğitim sisteminde eşitlik ve akademik başarı, araştırma raporu ve analiz. İstanbul: Sabancı Üniversitesi Yayınları.
  • Özeren, E., Çiloğlu, T., Yilmaz, R., & Özeren, A. (2020). Öğrencilerin akademik kariyer hedefi seçiminde etkili olan faktörlerin veri madenciliği yöntemi ile belirlenmesi: Bartın başarı takip araştırması sonuçları üzerine bir inceleme. Bilgi ve İletişim Teknolojileri Dergisi, 2(2), 182-210.
  • Rajak, A., Shrivastava, A. K., & Vidushi. ,2020. Applying and comparing machine learning classification algorithms for predicting the results of students. Journal of Discrete Mathematical Sciences & Cryptography, 23(2, 419-427. doi:10.1080/09720529.2020.1728895
  • Rebai, S., Ben Yahia, F., & Essid, H. ,2020. A graphically based machine learning approach to predict secondary schools performance in Tunisia. Socio-Economic Planning Sciences, 70, 100724. doi:ARTN 100724 10.1016/j.seps.2019.06.009
  • Sethi, K., Jaiswal, V., & Ansari, M. D. ,2020. Machine learning based support system for students to select stream ,subject). Recent Advances in Computer Science and Communications ,Formerly: Recent Patents on Computer Science), 13(3), 336-344.
  • Shokry, A., Audino, F., Vicente, P., Escudero, G., Moya, M. P., Graells, M., & Espuña, A. ,2015. Modeling and simulation of complex nonlinear dynamic processes using data-based models: Application to photo-Fenton process. In Computer Aided Chemical Engineering (Vol. 37, pp. 191-196): Elsevier.
  • Therneau, T. M., & Atkinson, E. J. ,1997. An introduction to recursive partitioning using the RPART routines. Retrieved from
  • Uğuz, S. ,2019. Makine Öğrenmesi Teorik Yönleri ve Python Uygulamaları ile Bir Yapay Zeka Ekolü. Ankara: Nobel.
  • Uskov, V. L., Bakken, J. P., Byerly, A., & Shah, A. ,2019. Machine learning-based predictive analytics of student academic performance in STEM education. Paper presented at the 2019 IEEE Global Engineering Education Conference (EDUCON).
  • Vapnik, V. ,1992. Principles of risk minimization for learning theory. Paper presented at the Advances in Neural Information Processing Systems.
  • Yavuz, A., 2020. Ortaöğretime geçiş sınavında öğrenci başarısını etkileyen etmenler.
  • Yousafzai, B. K., Hayat, M., & Afzal, S. , 2020. Application of machine learning and data mining in predicting the performance of intermediate and secondary education level student. Education and Information Technologies, 25(6), 4677-4697. doi:10.1007/s10639-020-10189-1
There are 27 citations in total.

Details

Primary Language English
Subjects Artificial Intelligence
Journal Section Research Articles
Authors

Tuba Koc 0000-0001-5204-0846

Pelin Akın 0000-0003-3798-4827

Publication Date March 2, 2022
Submission Date April 20, 2021
Published in Issue Year 2022 Volume: 5 Issue: 1

Cite

APA Koc, T., & Akın, P. (2022). Estimation of High School Entrance Examination Success Rates Using Machine Learning and Beta Regression Models. Journal of Intelligent Systems: Theory and Applications, 5(1), 9-15. https://doi.org/10.38016/jista.922663
AMA Koc T, Akın P. Estimation of High School Entrance Examination Success Rates Using Machine Learning and Beta Regression Models. JISTA. March 2022;5(1):9-15. doi:10.38016/jista.922663
Chicago Koc, Tuba, and Pelin Akın. “Estimation of High School Entrance Examination Success Rates Using Machine Learning and Beta Regression Models”. Journal of Intelligent Systems: Theory and Applications 5, no. 1 (March 2022): 9-15. https://doi.org/10.38016/jista.922663.
EndNote Koc T, Akın P (March 1, 2022) Estimation of High School Entrance Examination Success Rates Using Machine Learning and Beta Regression Models. Journal of Intelligent Systems: Theory and Applications 5 1 9–15.
IEEE T. Koc and P. Akın, “Estimation of High School Entrance Examination Success Rates Using Machine Learning and Beta Regression Models”, JISTA, vol. 5, no. 1, pp. 9–15, 2022, doi: 10.38016/jista.922663.
ISNAD Koc, Tuba - Akın, Pelin. “Estimation of High School Entrance Examination Success Rates Using Machine Learning and Beta Regression Models”. Journal of Intelligent Systems: Theory and Applications 5/1 (March 2022), 9-15. https://doi.org/10.38016/jista.922663.
JAMA Koc T, Akın P. Estimation of High School Entrance Examination Success Rates Using Machine Learning and Beta Regression Models. JISTA. 2022;5:9–15.
MLA Koc, Tuba and Pelin Akın. “Estimation of High School Entrance Examination Success Rates Using Machine Learning and Beta Regression Models”. Journal of Intelligent Systems: Theory and Applications, vol. 5, no. 1, 2022, pp. 9-15, doi:10.38016/jista.922663.
Vancouver Koc T, Akın P. Estimation of High School Entrance Examination Success Rates Using Machine Learning and Beta Regression Models. JISTA. 2022;5(1):9-15.

Journal of Intelligent Systems: Theory and Applications