In the process of learning analytics, the determination of outliers and
making smoothing before the analysis stage has an important place in reaching
the right patterns. The outliers can be determined in the real-time, as well
as, at the end of the data collection process. In this study, the use of
outlier detection methods is discussed using educational data from an
e-learning environment. Also, the methods were tested on a real-time system.
The Moodle, Learning Management System (LMS) log records were used as the data
set. The study group consists of 65 students. In this study, the total
interaction times in hypertext, video, assessment, scorm, and forum themes were
used as data set. Box-plot, Z, Grubbs, Rosner and Hampel methods were used to
determine the outliers. Outliers are determined by processing through manual
calculations without using the existing packaged software. At the same time, in
order to evaluate integrability of these methods into the e-learning environment,
some PHP script examples are coded by researchers. As a result of analyzes, it
was shown that outlier numbers changed according to the methods. When the
experiences obtained therefrom and database structure are considered; Z and
Box-Plot methods are easier to implement in e-learning systems, for the
real-time outlier detection than other methods. In other words, it has been
seen that these methods are more functional in machine teaching. However, it
should be noted that other methods have significant advantages, for that they
require hypothesis test and give more sensitive results. In the context of
machine learning, the positive and negative characteristics of these methods
are discussed.
e-learning outlier data preprocessing anomaly detection learning analytics educational data mining
E-öğrenme teknolojilerinin sağladığı en önemli yararlardan birisi
de öğrenme verilerinin kayıt edilmesidir. Bu veriler eğitsel veri madenciliği
bağlamında analiz edilmekte ve aynı zamanda öğrenme analitikleri olarak da
kullanılmaktadır. Ancak kayıt edilen her veri sağlıklı bir öğrenme verisi
anlamına gelmemektedir. Bu nedenle analiz aşamasından önce aykırı gözlemlerin
belirlenmesi ve düzeltmelerin yapılması doğru sonuçlara ulaşılmasında önemli
bir yere sahiptir. Aykırı gözlemler, verilerin oluşma sürecinde (real-time)
belirlenebileceği gibi süreç sonunda elde edilen veri kümelerinden de
belirlenebilmektedir. Bu araştırmada bir e-öğrenme ortamından elde edilen
eğitsel veriler üzerinde aykırı gözlem belirleme yöntemlerinin kullanımı ele
alınmıştır. Araştırmada bir ders dönemi süresinde kullanılan Moodle öğrenme yönetim
sistemi (ÖYS) log kayıtları veri kümesi olarak kullanılmıştır. Veri kümesi 65
öğrencinin hiper-metin, video,
değerlendirme, scorm ve forum etkileşimlerine ilişkin toplam etkileşim
süresinden oluşmaktadır. Aykırı gözlem verilerinin belirlenmesinde Z, Grubbs,
Rosner, kutu grafiği ve
Hampel yöntemi kullanılmıştır. Bu çalışmada aykırı gözlem verileri hazır paket
programlar kullanılmadan hesaplama çizelgeleri üzerinden işlemler yapılarak
belirlenmiştir. Yapılan analizlerin sonucunda yöntemlere göre aykırı (anormal)
gözlem sayılarının değiştiği görülmüştür. Buradan elde edilen deneyimler ve
veri tabanı yapısı göz önünde bulundurulduğunda Z yöntemi ve kutu grafiği
yöntemlerinin bir e-öğrenme sisteminde uygulama anında aykırı gözlemlerin
tespiti amacıyla diğer yöntemlere göre daha kolay uygulanabilir olduğu, bir
başka ifadeyle bu yöntemlerin makineye öğretiminin daha işlevsel olduğu
görülmüştür. Bununla birlikte diğer yöntemlerin ise bir hipotez sınaması
gerektirmesi ve daha duyarlı sonuçlar vermesi yönünden önemli bir avantaja
sahip olduğu göz önünde bulundurulmalıdır.
e-öğrenme aykırı gözlem veri ön işleme öğrenme analitikleri eğitsel veri madenciliği
Birincil Dil | Türkçe |
---|---|
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 31 Ocak 2019 |
Yayımlandığı Sayı | Yıl 2019 Cilt: 9 Sayı: 1 |