In this study, it was aimed to predict the performance of the students in the next exams according to the exam data they entered. As the data set, in the 1st semester of the 2021-2022 academic year, Dr. The score distributions of 87 students studying in the 10th and 11th grades of Nureddin Erk-Perihan Erk Vocational and Technical Anatolian High School in the field of Information Technologies in the 3 exams applied in the Object-Oriented and Programming course were used. The questions in the exams were matched with the achievement titles in the course information form, and the performance rates of each student were tabulated according to the achievement titles. Synthetic data were produced using real data collected due to limited data. The degree of closeness of the synthetic data to reality was confirmed by the detailed result report. Since more than one performance value will be estimated, linear regression, k-nearest neighbor and decision tree algorithms supporting multi-output regression are used. K-layer cross validation was applied to evaluate the success of the algorithms. MAE, MSE, R2 and standard deviation were calculated for performance measurements. For overfitting solution, the performance is improved by finding the best parameter values in KNN and decision tree algorithms. According to the results, the best performance values were obtained with KNN. As a continuation of this study, a system in which exam data of all courses will be entered can be designed and the performance connections between courses can be analyzed. Thus, future failures of students can be prevented and the quality of education can be increased according to performance predictions.
Educational data mining student performance prediction multi-output regression synthetic data machine learning
Yapılan bu çalışmada öğrencilerin girdiği sınav verilerine göre sonraki sınavlardaki performansları tahmin edilmek istenmiştir. Veri kümesi olarak, 2021-2022 eğitim öğretim yılı 1. döneminde, İstanbul ili Ataşehir ilçesinde bulunan Dr. Nureddin Erk-Perihan Erk Mesleki ve Teknik Anadolu Lisesi, Bilişim Teknolojileri alanındaki 10 ve 11’inci sınıfta okuyan 87 öğrencinin Nesne Tabanlı ve Programlama dersinde uygulanan 3 sınavdaki puan dağılımları kullanılmıştır. Sınavlardaki sorular ders bilgi formundaki kazanım başlıklarıyla eşleştirilmiş, her öğrencinin kazanım başlıklarına göre performans oranları tablo haline getirilmiştir. Verilerin kısıtlı olmasından dolayı toplanan gerçek veriler kullanılarak sentetik veriler üretilmiştir. Sentetik verinin gerçeğe yakınlık derecesi detaylı sonuç raporu ile teyit edilmiştir. Birden çok sayıda performans değeri tahmin edileceğinden, çok çıkışlı regresyonu destekleyen doğrusal regresyon, k-en yakın komşu ve karar ağacı algoritmaları kullanılmıştır. Algoritmaların başarı değerlendirmesi için k katmanlı çapraz doğrulama uygulanmıştır. Performans ölçümleri için MAE, MSE, R2 ve standart sapma hesaplanmıştır. Aşırı uyum çözümü için KNN ve karar ağacı algoritmalarında en iyi parametre değerleri bulunarak performans iyileştirilmiştir. Sonuçlara göre en iyi performans değerleri KNN ile elde edilmiştir. Bu çalışmanın devamı olarak tüm derslerin sınav verilerinin girileceği bir sistem tasarlanarak dersler arasındaki performans bağlantıları analiz edilebilir. Böylece performans tahminlerine göre öğrencilerin gelecekteki başarısızlıkları bugünden önlenebilir ve eğitim kalitesi arttırılabilir.
Eğitsel veri madenciliği öğrenci performans tahmini çok çıktılı regresyon sentetik veri makine öğrenmesi
Primary Language | Turkish |
---|---|
Subjects | Artificial Intelligence |
Journal Section | Research Articles |
Authors | |
Early Pub Date | December 27, 2022 |
Publication Date | March 15, 2023 |
Submission Date | October 2, 2022 |
Published in Issue | Year 2023 Volume: 6 Issue: 1 |
Journal
of Intelligent Systems: Theory and Applications