Araştırma Makalesi

Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması

Cilt: 51 Sayı: 3 1 Aralık 2018
PDF İndir
TR

Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması

Öz

Bu çalışmada veri madenciliği ve makine öğrenme yaklaşımının eğitim alanında kullanılması ve bu algoritmalara dayalı olarak elde edilen sonuçların güvenirlik ve geçerlik değerlerinin ne düzeyde olduğu belirlenmeye çalışılmıştır. PISA 2015 Türkiye ortalamasına göre öğrencilerin başarılı ve başarısız olarak sınıflandığı çalışmada farklı öğrenme yöntemleri kullanılarak fen okuryazarlığı bakımından öğrencilerin hangi sınıfta yer alacağı tahmin edilmiş ve bu aşamada elde edilen sonuçların güvenirlik ve geçerlik ölçütleri incelenmiştir. Çalışma kapsamında ele alınan 8 farklı öğrenme yönteminden doğru sınıflama sayısı, doğru sınıflama oranı, kappa istatistiği, karekök hata ve göreceli karekök hata değerleri bakımından en iyi sonuçların Random Forest yöntemiyle elde edilirken Ridge lojistik regresyon, Lojistik model ve Hoefding tree yöntemlerinin en başarılı diğer yöntemler olduğu belirlenmiştir. Çapraz geçerleme yöntemi kullanılmadan tüm veri setinin eğitim ve test veri seti olarak ayrılması durumunda Lojistik model, Random Forest ve Ridge Regresyon yöntemlerinin farklı büyüklükteki test verilerinde en düşük hata değerlerini verirken Random Tree ve J.48 yönteminlerinin en yüksek hata değerlerine sahip olduğu belirlenmiştir. Ridge regresyon, Random forest ve Lojistik model tarafından elde edilen hata değerlerinin de farklı yüzdelikteki test verilerinde oldukça tutarlı olduğu sonucuna ulaşılmıştır. Farklı yöntemler yardımıyla elde edilen ölçme sonuçlarının veri setini test ve eğitim verisi olarak ayırmayıp aynı veri seti üzerinden hem öğrenme yöntemini eğitip hem de test ettiğimiz taktirde özellikle Random tree ve J.48 öğrenme yöntemlerinin gerçek performanslarından daha yüksek doğru sınıflama oranına sahip oldukları belirlenmiştir.

Anahtar Kelimeler

Kaynakça

  1. Ahmed, A. B., & Elaraby, I. S. (2014) Data Mining: A prediction for student's performance using classification method. World Journal of Computer Application and Technology, 2 (2), 43-47.
  2. Boss, D. D. (2003). Introduction to the Bootstrap World, Statistical Science, 18 (2), 168-174.
  3. Bramer, M. (2013). Principles of Data Mining (2nd ed.), London: Springer-Verlag.
  4. Brown, M. S. (2014). Data Mining For Dummies, Hoboken, New Jersey: John Wiley & Sons.
  5. Chamatkar, A. J., & Butey, P. K. (2014) Importance of data mining with different types of data applications and challenging areas, Journal of Engineering Research and Applications, 4 (5), 38-41.
  6. Chen, S. X. and J. S. Liu (1997). Statistical applications of the Poisson-binomial and conditional Bernoulli distributions. Statistica Sinica 7, 875–892.
  7. Dekking, F. M., Kraaikamp, C., Lopuhaa, H. P. & Meester, L. E. (2005) A modern ıntroduction to probability and statistics: understanding why and how, United States of America: Springer Science+Business Media.
  8. Domingos, P. (2012), A few useful things to know about machine learning, Communications of the ACM, 55 (10), 78–87.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Eğitim Üzerine Çalışmalar

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

1 Aralık 2018

Gönderilme Tarihi

26 Eylül 2018

Kabul Tarihi

10 Kasım 2018

Yayımlandığı Sayı

Yıl 2018 Cilt: 51 Sayı: 3

Kaynak Göster

APA
Aksu, G., & Doğan, N. (2018). Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması. Ankara University Journal of Faculty of Educational Sciences (JFES), 51(3), 71-100. https://doi.org/10.30964/auebfd.464262
AMA
1.Aksu G, Doğan N. Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması. AÜEBFD. 2018;51(3):71-100. doi:10.30964/auebfd.464262
Chicago
Aksu, Gökhan, ve Nuri Doğan. 2018. “Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması”. Ankara University Journal of Faculty of Educational Sciences (JFES) 51 (3): 71-100. https://doi.org/10.30964/auebfd.464262.
EndNote
Aksu G, Doğan N (01 Aralık 2018) Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması. Ankara University Journal of Faculty of Educational Sciences (JFES) 51 3 71–100.
IEEE
[1]G. Aksu ve N. Doğan, “Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması”, AÜEBFD, c. 51, sy 3, ss. 71–100, Ara. 2018, doi: 10.30964/auebfd.464262.
ISNAD
Aksu, Gökhan - Doğan, Nuri. “Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması”. Ankara University Journal of Faculty of Educational Sciences (JFES) 51/3 (01 Aralık 2018): 71-100. https://doi.org/10.30964/auebfd.464262.
JAMA
1.Aksu G, Doğan N. Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması. AÜEBFD. 2018;51:71–100.
MLA
Aksu, Gökhan, ve Nuri Doğan. “Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması”. Ankara University Journal of Faculty of Educational Sciences (JFES), c. 51, sy 3, Aralık 2018, ss. 71-100, doi:10.30964/auebfd.464262.
Vancouver
1.Gökhan Aksu, Nuri Doğan. Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması. AÜEBFD. 01 Aralık 2018;51(3):71-100. doi:10.30964/auebfd.464262

Cited By

Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi, CC BY-NC-ND 4.0 lisansını kullanmaktadır.