Araştırma Makalesi
BibTex RIS Kaynak Göster

Using Scikit-Learn in Student Achievement Prediction

Yıl 2025, Cilt: 8 Sayı: 3, 1042 - 1060, 16.06.2025
https://doi.org/10.47495/okufbed.1543982

Öz

Predicting student achievement is desired by all educational institutions, but it is difficult due to the many factors that influence achievement and the normally unstable nature of the data. In this challenging process, machine learning approaches are utilized to predict student achievement. In machine learning studies, which is an experience-based approach, obtaining the data set subject to the research is an important step in this approach. However, it can be difficult, time-consuming and costly to process and analyze the obtained data. To overcome this problem, free python libraries such as Scikit-learn can be utilized. In this study, it is aimed to analyze student performance prediction processes, which are of great importance in educational data sets, using Scikit-learn and to contribute to the literature and researchers by sharing the process with the code scripts used. In this context, Naive Bayes (NB), Random Forest (RF), Support Vector Machine (SVM), Decision Tree (DT) algorithms were used respectively. Accuracy, Precision, Recall, F1-score, kappa and confusion matrix criteria, which are widely used in academic research, were used to express the success of the developed prediction model.

Kaynakça

  • Alan A., Karabatak M. Veri seti- sınıflandırma ilişkisinde performansa etki eden faktörlerin değerlendirilmesi. Fırat Üniversitesi Müh.Mil.Dergisi 2020; 32(2): 531-540.
  • Araque F., Roldan C., Salgu A. Factors influencing university drop out rates. Computers Education 2009; 53(3): 563-574.
  • Aydın F. Kalp ritim bozukluğu olan hastaların tedavi süreçlerini desteklemek amaçlı makine öğrenmesine dayalı bir sistemin geliştirilmesi, Yüksek Lisans Tezi 2011; 39-41.
  • Ayvaz U., Gürüler H. Real-time detection of students' emotional states in the classroom. 2017 25th Signal Processing and Communications Applications Conference (SIU) 2017; 1-4.
  • Belachew E., Gobena F. Student performance prediction model using machine learning approach: The case of Wolkite University. ", International Journal of Advanced Research in Computer Science and Software Engineering 2017; 7(2): 46-50.
  • Bhawana A., Bharti G. Review on data mining techniques used for educational system. International Journal of Emerging Technology and Advanced Engineering 2014; 4(11): 325-329.
  • Bulut F. Performance analysis of ensemble methods on imbalanced datasets. Bilişim Teknolojileri Dergisi 2016; 9(2): 153-159.
  • Caruana R., Niculescu-Mizil A. An empirical comparison of supervised learning algorithms. Proceedings of the 23rd International Conference on Machine learning 2006: 161–168.
  • Decision Trees. scikit-learn.org: https://scikit-learn.org/stable/modules/tree.html adresinden alındı.2022 Deekshith C. Review on advanced machine learning model: Scikit-Learn. Social Science Research Network 2020.
  • Demirhan T. Makine öğrenmesi algoritmalarının karmaşıklık ve doygunluk analizinin bir veri kümesi üzerinde gerçekleştirilmesi. Yayınlanmış Doktora Tezi, Trakya Üniversitesi Fen Bilimleri Enstitüsü 2015, Edirne.
  • Guleria P., Sood M. Data mining in education : A review on the knowledge dıscovery perspective. International Journal of Data Mining Knowledge Management Process (IJDKP) 2014; 4(5): 47-60.
  • Jiangang H., Tin K. Machine learning made easy: A review of scikit-learn package in python programming language. Journal of Educational and Behavioral Statistics 2019; 44(3): 348-361.
  • Jović A., Brkić K., Bogunović N. An overview of free software tools for general data mining. MIPRO 2014, 26-30 May 2014, Opatija, Croatia 2014: 1112-117.
  • Kalaycı TE. Kimlik hırsızı web sitelerinin sınıflandırılması için makine öğrenmesi yöntemlerinin karşılaştırılması. Pamukkale Univ Muh Bilim Dergisi 2018; 24(5): 870-878.
  • Kamalov F., Thabtah F., Leung HH. Feature selection in imbalance Data. Annals of Data Science 2022; 1-15.
  • Kaynar O., Yıldız M., Görmez Y., Albayrak A. Makine öğrenmesi yöntemleri ile duygu analizi. International Artificial Intelligence and Data Processing Symposium (IDAP'16), 17-18 Eylül, Malatya: IDAP'16 2016; 1-8
  • Khan I., Sadiri A., Ahmad A., Jabeur N. Tracking student performance in ıntroductory programming by means of machine learning. 4th MEC International Conference on Big Data and Smart City (ICBDSC). Muscat, Oman 2019
  • Klement W., Wilk S., Michaowski W., Matwin S. Dealing with severely imbalanced data. In: ICEC 2009 Workshop, PAKDD, 2009:1-16
  • Komer B., Bergstra J., Eliasmith C. Hyperopt-sklearn: Automatic hyperparameter configuration for Scikit-Learn. Proc. of The 13th Python in Science Conf. (SCIPY 2014). 2014.
  • Mishra T., Kumar, D., Gupta S. Students’ employability prediction model through data mining. International Journal of Applied Engineering Research 2016; 11(4): 2279.
  • Namlı E., Ünlü R., Gül E. Fı̇yat tahmı̇nlemesı̇nde makı̇ne öğrenmesı̇ teknı̇klerı̇ ve doğrusal regresyon yöntemlerı̇nı̇n kıyaslanması; Türkı̇ye’de satılan ı̇kı̇ncı̇ el araç fı̇yatlarının tahmı̇nlenmesı̇ne yönelı̇k bı̇r vaka çalışması. Konya Mühendislik Bilimleri Dergisi 2019; 7(4): 806-821.
  • Özen NS. COVID-19 Vakalarının makine öğrenmesi algoritmaları ile tahmini: Amerika Birleşik Devletleri Örneği. Avrupa Bilim ve Teknoloji Dergisi 2021; 22: 134-139.
  • Özhan E. Yapay zeka yöntemleri ile dünya depremlerinin modellene bilirliği. Isıtes2014. Karabük: Isıtes2014.
  • Rahman Rony A., Tabassum Amity N., Amir M. Student performance prediction using machine learning approach and data mining techniques 2020. Bangladesh: Daffodil International University Dhaka.
  • Russell S., Norvig P. Artificial ıntelligence a modern approach Third Edition 2010:702-703.
  • Soni A., Kumar V., Kaur R., Hemavathi D. Predicting student performance using data mining techniques. International Journal of Pure and Applied Mathematics 2018; 119(12): 221-227.
  • Stančin I., Jović A. An overview and comparison of free Python libraries for data mining and big data analysis. 2019 42nd International Convention on Information and Communication Technology, Electronics and Microelectronics (MIPRO), 2019, Opatija, Croatia. 20-24
  • Şenel FA. Makine öğrenmesi algoritmaları kullanılarak kayısı ı̇ç çekirdeklerinin sınıflandırılması. BEÜ Fen Bilimleri Dergisi 2020; 9(2): 807-815.
  • Uğuz S., Oral O. PV güç santrallerinden elde edilecek enerjinin makine öğrenmesi metotları kullanılarak tahmin edilmesi. International Journal of Engineering Research and Development 2019; 11(3): 769-779.
  • Varoquaux G., Buitinck L., Louppe G., Grisel O. Scikit-learn: Machine learning without learning the machinery. GetMobile: Mobile Computing and Communications 2015; 19(1): 29–33.
  • Web1: https://www.karabayyazilim.com/blog/python/scikit-learn-nedir-2020-02-12-062241. Erişim Tarihi: 09.05.2023.
  • Web 2: https://www.datacamp.com/community/tutorials/naive-bayes-scikit-learn. Erişim Tarihi, 19.05.2023.
  • Web 3: https://medium.com/@gulcanogundur/roc-ve-auc-1fefcfc71a14. Erişim Tarihi: 20.05.2023.
  • Web 4: https://scikit-learn.org/stable/about.html#.Erişim Tarihi: 20.06.2023.
  • Web 5: https://medium.com/@gulcanogundur/roc-ve-auc-1fefcfc71a14. Erişim Tarihi: 20.05.2023.
  • Web 6: scikit-learn.org/:https://scikit-learn.org/stable/modules/svm.html. Erişim Tarihi: 20.05.2023.
  • Web 7: scikit-learn.org/:https://medium.com/kaveai/naive-bayes-ve-uygulamalarıd7d5a56c689b.Erişim Tarihi: 20.05.2023.

Öğrenci Başarısı Tahmininde Scikit-Learn Kullanımı

Yıl 2025, Cilt: 8 Sayı: 3, 1042 - 1060, 16.06.2025
https://doi.org/10.47495/okufbed.1543982

Öz

Öğrencilerin başarı durumunu öngörmek tüm eğitim kurumları tarafından istenen bir durum olmakla birlikte başarıya etki eden çok faktör olması ve verilerin normalde dengesiz olmasından dolayı oldukça zordur. Bu zorlu süreçte, öğrencinin başarısını tahmin etmek için makine öğrenmesi yaklaşımlarından faydalanılmaktadır. Deneyime dayalı bir yaklaşım olan makine öğrenmesi çalışmalarında; araştırmaya konu olan veri setinin elde edilmesi bu yaklaşımın önemli bir adımıdır. Ancak elde edilen veriler ile işlem ve analizler yapabilmek zordur. Bununla birlikte zaman alıcı ve maliyetli olabilmektedir. Bu sorunun üstesinden gelmek için Scikit-learn gibi ücretsiz python kütüphanelerinden faydalanılabilmektedir. Bu çalışmada; eğitim alanlı veri setlerinde büyük öneme sahip öğrenci performans tahmin işlemlerinin, Scikit-learn kullanılarak analiz edilmesi ve sürecin kullanılan kod betikleri ile birlikte paylaşılarak literatüre ve araştırmacılara katkı sunması amaçlanmıştır. Bu bağlamda çalışmada sırasıyla Naive Bayes (NB), Rastgele Orman (RO), Destek vektör Makinesi (DVM), Karar Ağacı (KA) algoritmaları kullanılmıştır. Geliştirilen tahmin modelinin başarısını ifade etmek için akademik araştırmalarda yaygın olarak kullanılan doğruluk, kesinlik, duyarlılık, F1-puan, kappa ve karışıklık matrisi ölçütleri kullanılmıştır.

Kaynakça

  • Alan A., Karabatak M. Veri seti- sınıflandırma ilişkisinde performansa etki eden faktörlerin değerlendirilmesi. Fırat Üniversitesi Müh.Mil.Dergisi 2020; 32(2): 531-540.
  • Araque F., Roldan C., Salgu A. Factors influencing university drop out rates. Computers Education 2009; 53(3): 563-574.
  • Aydın F. Kalp ritim bozukluğu olan hastaların tedavi süreçlerini desteklemek amaçlı makine öğrenmesine dayalı bir sistemin geliştirilmesi, Yüksek Lisans Tezi 2011; 39-41.
  • Ayvaz U., Gürüler H. Real-time detection of students' emotional states in the classroom. 2017 25th Signal Processing and Communications Applications Conference (SIU) 2017; 1-4.
  • Belachew E., Gobena F. Student performance prediction model using machine learning approach: The case of Wolkite University. ", International Journal of Advanced Research in Computer Science and Software Engineering 2017; 7(2): 46-50.
  • Bhawana A., Bharti G. Review on data mining techniques used for educational system. International Journal of Emerging Technology and Advanced Engineering 2014; 4(11): 325-329.
  • Bulut F. Performance analysis of ensemble methods on imbalanced datasets. Bilişim Teknolojileri Dergisi 2016; 9(2): 153-159.
  • Caruana R., Niculescu-Mizil A. An empirical comparison of supervised learning algorithms. Proceedings of the 23rd International Conference on Machine learning 2006: 161–168.
  • Decision Trees. scikit-learn.org: https://scikit-learn.org/stable/modules/tree.html adresinden alındı.2022 Deekshith C. Review on advanced machine learning model: Scikit-Learn. Social Science Research Network 2020.
  • Demirhan T. Makine öğrenmesi algoritmalarının karmaşıklık ve doygunluk analizinin bir veri kümesi üzerinde gerçekleştirilmesi. Yayınlanmış Doktora Tezi, Trakya Üniversitesi Fen Bilimleri Enstitüsü 2015, Edirne.
  • Guleria P., Sood M. Data mining in education : A review on the knowledge dıscovery perspective. International Journal of Data Mining Knowledge Management Process (IJDKP) 2014; 4(5): 47-60.
  • Jiangang H., Tin K. Machine learning made easy: A review of scikit-learn package in python programming language. Journal of Educational and Behavioral Statistics 2019; 44(3): 348-361.
  • Jović A., Brkić K., Bogunović N. An overview of free software tools for general data mining. MIPRO 2014, 26-30 May 2014, Opatija, Croatia 2014: 1112-117.
  • Kalaycı TE. Kimlik hırsızı web sitelerinin sınıflandırılması için makine öğrenmesi yöntemlerinin karşılaştırılması. Pamukkale Univ Muh Bilim Dergisi 2018; 24(5): 870-878.
  • Kamalov F., Thabtah F., Leung HH. Feature selection in imbalance Data. Annals of Data Science 2022; 1-15.
  • Kaynar O., Yıldız M., Görmez Y., Albayrak A. Makine öğrenmesi yöntemleri ile duygu analizi. International Artificial Intelligence and Data Processing Symposium (IDAP'16), 17-18 Eylül, Malatya: IDAP'16 2016; 1-8
  • Khan I., Sadiri A., Ahmad A., Jabeur N. Tracking student performance in ıntroductory programming by means of machine learning. 4th MEC International Conference on Big Data and Smart City (ICBDSC). Muscat, Oman 2019
  • Klement W., Wilk S., Michaowski W., Matwin S. Dealing with severely imbalanced data. In: ICEC 2009 Workshop, PAKDD, 2009:1-16
  • Komer B., Bergstra J., Eliasmith C. Hyperopt-sklearn: Automatic hyperparameter configuration for Scikit-Learn. Proc. of The 13th Python in Science Conf. (SCIPY 2014). 2014.
  • Mishra T., Kumar, D., Gupta S. Students’ employability prediction model through data mining. International Journal of Applied Engineering Research 2016; 11(4): 2279.
  • Namlı E., Ünlü R., Gül E. Fı̇yat tahmı̇nlemesı̇nde makı̇ne öğrenmesı̇ teknı̇klerı̇ ve doğrusal regresyon yöntemlerı̇nı̇n kıyaslanması; Türkı̇ye’de satılan ı̇kı̇ncı̇ el araç fı̇yatlarının tahmı̇nlenmesı̇ne yönelı̇k bı̇r vaka çalışması. Konya Mühendislik Bilimleri Dergisi 2019; 7(4): 806-821.
  • Özen NS. COVID-19 Vakalarının makine öğrenmesi algoritmaları ile tahmini: Amerika Birleşik Devletleri Örneği. Avrupa Bilim ve Teknoloji Dergisi 2021; 22: 134-139.
  • Özhan E. Yapay zeka yöntemleri ile dünya depremlerinin modellene bilirliği. Isıtes2014. Karabük: Isıtes2014.
  • Rahman Rony A., Tabassum Amity N., Amir M. Student performance prediction using machine learning approach and data mining techniques 2020. Bangladesh: Daffodil International University Dhaka.
  • Russell S., Norvig P. Artificial ıntelligence a modern approach Third Edition 2010:702-703.
  • Soni A., Kumar V., Kaur R., Hemavathi D. Predicting student performance using data mining techniques. International Journal of Pure and Applied Mathematics 2018; 119(12): 221-227.
  • Stančin I., Jović A. An overview and comparison of free Python libraries for data mining and big data analysis. 2019 42nd International Convention on Information and Communication Technology, Electronics and Microelectronics (MIPRO), 2019, Opatija, Croatia. 20-24
  • Şenel FA. Makine öğrenmesi algoritmaları kullanılarak kayısı ı̇ç çekirdeklerinin sınıflandırılması. BEÜ Fen Bilimleri Dergisi 2020; 9(2): 807-815.
  • Uğuz S., Oral O. PV güç santrallerinden elde edilecek enerjinin makine öğrenmesi metotları kullanılarak tahmin edilmesi. International Journal of Engineering Research and Development 2019; 11(3): 769-779.
  • Varoquaux G., Buitinck L., Louppe G., Grisel O. Scikit-learn: Machine learning without learning the machinery. GetMobile: Mobile Computing and Communications 2015; 19(1): 29–33.
  • Web1: https://www.karabayyazilim.com/blog/python/scikit-learn-nedir-2020-02-12-062241. Erişim Tarihi: 09.05.2023.
  • Web 2: https://www.datacamp.com/community/tutorials/naive-bayes-scikit-learn. Erişim Tarihi, 19.05.2023.
  • Web 3: https://medium.com/@gulcanogundur/roc-ve-auc-1fefcfc71a14. Erişim Tarihi: 20.05.2023.
  • Web 4: https://scikit-learn.org/stable/about.html#.Erişim Tarihi: 20.06.2023.
  • Web 5: https://medium.com/@gulcanogundur/roc-ve-auc-1fefcfc71a14. Erişim Tarihi: 20.05.2023.
  • Web 6: scikit-learn.org/:https://scikit-learn.org/stable/modules/svm.html. Erişim Tarihi: 20.05.2023.
  • Web 7: scikit-learn.org/:https://medium.com/kaveai/naive-bayes-ve-uygulamalarıd7d5a56c689b.Erişim Tarihi: 20.05.2023.
Toplam 37 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Takviyeli Öğrenme
Bölüm Araştırma Makalesi
Yazarlar

Tolga Demirhan 0000-0001-9840-4457

Gönderilme Tarihi 5 Eylül 2024
Kabul Tarihi 3 Şubat 2025
Yayımlanma Tarihi 16 Haziran 2025
Yayımlandığı Sayı Yıl 2025 Cilt: 8 Sayı: 3

Kaynak Göster

APA Demirhan, T. (2025). Öğrenci Başarısı Tahmininde Scikit-Learn Kullanımı. Osmaniye Korkut Ata Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 8(3), 1042-1060. https://doi.org/10.47495/okufbed.1543982
AMA 1.Demirhan T. Öğrenci Başarısı Tahmininde Scikit-Learn Kullanımı. Osmaniye Korkut Ata Üniversitesi Fen Bilimleri Enstitüsü Dergisi. 2025;8(3):1042-1060. doi:10.47495/okufbed.1543982
Chicago Demirhan, Tolga. 2025. “Öğrenci Başarısı Tahmininde Scikit-Learn Kullanımı”. Osmaniye Korkut Ata Üniversitesi Fen Bilimleri Enstitüsü Dergisi 8 (3): 1042-60. https://doi.org/10.47495/okufbed.1543982.
EndNote Demirhan T (01 Haziran 2025) Öğrenci Başarısı Tahmininde Scikit-Learn Kullanımı. Osmaniye Korkut Ata Üniversitesi Fen Bilimleri Enstitüsü Dergisi 8 3 1042–1060.
IEEE [1]T. Demirhan, “Öğrenci Başarısı Tahmininde Scikit-Learn Kullanımı”, Osmaniye Korkut Ata Üniversitesi Fen Bilimleri Enstitüsü Dergisi, c. 8, sy 3, ss. 1042–1060, Haz. 2025, doi: 10.47495/okufbed.1543982.
ISNAD Demirhan, Tolga. “Öğrenci Başarısı Tahmininde Scikit-Learn Kullanımı”. Osmaniye Korkut Ata Üniversitesi Fen Bilimleri Enstitüsü Dergisi 8/3 (01 Haziran 2025): 1042-1060. https://doi.org/10.47495/okufbed.1543982.
JAMA 1.Demirhan T. Öğrenci Başarısı Tahmininde Scikit-Learn Kullanımı. Osmaniye Korkut Ata Üniversitesi Fen Bilimleri Enstitüsü Dergisi. 2025;8:1042–1060.
MLA Demirhan, Tolga. “Öğrenci Başarısı Tahmininde Scikit-Learn Kullanımı”. Osmaniye Korkut Ata Üniversitesi Fen Bilimleri Enstitüsü Dergisi, c. 8, sy 3, Haziran 2025, ss. 1042-60, doi:10.47495/okufbed.1543982.
Vancouver 1.Demirhan T. Öğrenci Başarısı Tahmininde Scikit-Learn Kullanımı. Osmaniye Korkut Ata Üniversitesi Fen Bilimleri Enstitüsü Dergisi [Internet]. 01 Haziran 2025;8(3):1042-60. Erişim adresi: https://izlik.org/JA57GS75JJ

23487




196541947019414  

1943319434 19435194361960219721 19784  2123822610 23877

* Uluslararası Hakemli Dergi (International Peer Reviewed Journal)

* Yazar/yazarlardan hiçbir şekilde MAKALE BASIM ÜCRETİ vb. şeyler istenmemektedir (Free submission and publication).

* Yılda Ocak, Mart, Haziran, Eylül ve Aralık'ta olmak üzere 5 sayı yayınlanmaktadır (Published 5 times a year)

* Dergide, Türkçe ve İngilizce makaleler basılmaktadır.

*Dergi açık erişimli bir dergidir.

Creative Commons License

Bu web sitesi Creative Commons Atıf 4.0 Uluslararası Lisansı ile lisanslanmıştır.