Predicting student achievement is desired by all educational institutions, but it is difficult due to the many factors that influence achievement and the normally unstable nature of the data. In this challenging process, machine learning approaches are utilized to predict student achievement. In machine learning studies, which is an experience-based approach, obtaining the data set subject to the research is an important step in this approach. However, it can be difficult, time-consuming and costly to process and analyze the obtained data. To overcome this problem, free python libraries such as Scikit-learn can be utilized. In this study, it is aimed to analyze student performance prediction processes, which are of great importance in educational data sets, using Scikit-learn and to contribute to the literature and researchers by sharing the process with the code scripts used. In this context, Naive Bayes (NB), Random Forest (RF), Support Vector Machine (SVM), Decision Tree (DT) algorithms were used respectively. Accuracy, Precision, Recall, F1-score, kappa and confusion matrix criteria, which are widely used in academic research, were used to express the success of the developed prediction model.
Scikit-learn Machine Learning Student Achievement Prediction
Öğrencilerin başarı durumunu öngörmek tüm eğitim kurumları tarafından istenen bir durum olmakla birlikte başarıya etki eden çok faktör olması ve verilerin normalde dengesiz olmasından dolayı oldukça zordur. Bu zorlu süreçte, öğrencinin başarısını tahmin etmek için makine öğrenmesi yaklaşımlarından faydalanılmaktadır. Deneyime dayalı bir yaklaşım olan makine öğrenmesi çalışmalarında; araştırmaya konu olan veri setinin elde edilmesi bu yaklaşımın önemli bir adımıdır. Ancak elde edilen veriler ile işlem ve analizler yapabilmek zordur. Bununla birlikte zaman alıcı ve maliyetli olabilmektedir. Bu sorunun üstesinden gelmek için Scikit-learn gibi ücretsiz python kütüphanelerinden faydalanılabilmektedir. Bu çalışmada; eğitim alanlı veri setlerinde büyük öneme sahip öğrenci performans tahmin işlemlerinin, Scikit-learn kullanılarak analiz edilmesi ve sürecin kullanılan kod betikleri ile birlikte paylaşılarak literatüre ve araştırmacılara katkı sunması amaçlanmıştır. Bu bağlamda çalışmada sırasıyla Naive Bayes (NB), Rastgele Orman (RO), Destek vektör Makinesi (DVM), Karar Ağacı (KA) algoritmaları kullanılmıştır. Geliştirilen tahmin modelinin başarısını ifade etmek için akademik araştırmalarda yaygın olarak kullanılan doğruluk, kesinlik, duyarlılık, F1-puan, kappa ve karışıklık matrisi ölçütleri kullanılmıştır.
| Birincil Dil | Türkçe |
|---|---|
| Konular | Takviyeli Öğrenme |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 5 Eylül 2024 |
| Kabul Tarihi | 3 Şubat 2025 |
| Yayımlanma Tarihi | 16 Haziran 2025 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 8 Sayı: 3 |
* Uluslararası Hakemli Dergi (International Peer Reviewed Journal)
* Yazar/yazarlardan hiçbir şekilde MAKALE BASIM ÜCRETİ vb. şeyler istenmemektedir (Free submission and publication).
* Yılda Ocak, Mart, Haziran, Eylül ve Aralık'ta olmak üzere 5 sayı yayınlanmaktadır (Published 5 times a year)
* Dergide, Türkçe ve İngilizce makaleler basılmaktadır.
*Dergi açık erişimli bir dergidir.
Bu web sitesi Creative Commons Atıf 4.0 Uluslararası Lisansı ile lisanslanmıştır.