Veri Madenciliğinde Kullanılan Güncel Bir Analiz Programı: WEKA
Abstract
Bu çalışmada veri madenciliği yöntemlerinden ve bu alanda en çok kullanılan programlardan birini tanıtmak amaçlanmıştır. Teknoloji çağının yaşandığı günümüzde sahip olunan bilgi miktarı sürekli artış göstermekte ve bu bilgilerden anlamlı sonuçlar çıkarmak oldukça değerli bir çalışma alanı olarak görülmektedir. Veri madenciliğinde büyük miktardaki verinin içinde saklı olan ve araştırmacılar için oldukça faydalı olan bilgilerin bir dizi işlemlerin ardından ortaya çıkarılması hedeflenmektedir. Genel olarak tahminleme ve sınıflama üzerine kurulu bu yaklaşımda yeni ve doğruluğu henüz tam olarak test edilmemiş birçok yazılım bulunmaktadır. Bu çalışmada alan yazında veri madenciliği ile ilgili tarama yaptığınızda ilk karşınıza çıkan programlardan biri olan WEKA yazılımının ne olduğu, programın nasıl çalıştırıldığı ve analizler ile çıktı dosyalarının neler içerdiği açıklanmaya çalışılmıştır. Çalışmada ayrıca bu program üzerinden analiz yapmak isteyen uygulayıcılar için yazılımın üstün yönlerinin neler olduğu anlatılarak neler yapabilecekleri konusunda önerilerde bulunulmuştur.
Keywords
References
- Bradley, E. & Tibshirani, R. J. (1993). An Introduction to the Bootstrap. Boca Raton, USA: Chapman and Hall
- Breiman L., Friedman J.H., Olsen E.A. & Stone C.J., (1984), Classification and Regression Trees, Belmont, CA: Wadsworth International Group.
- Fayyad, U. & Irani, K. (1992) On the handling of continuous-valued attributes in decision tree generation. Machine Learning, 8, 87–102.
- Holte, R. C. 1993. Very simple classification rules perform well on most commonly used datasets. Machine Learning 11:63–91.
- Ibarguren, I., Perez, J. M., Muguerza, J., Gurrutxaga, I & Arbelaitz, O. (2014). An update of the J48Consolidated WEKA’s class: CTC algorithm enhanced with the notion of coverage, Technical Report EHU-KAT-IK-02-14, University of the Basque Country
- Johari, R. (2016) MS&E 226: “Small” Data Lecture 8: Classification Problems, Lucture notes, Available from: http://web.stanford.edu/~rjohari/teaching/notes.html
- Kohavi R. (1995) A study of cross-validation and bootstrap for accuracy estimation and model selection. In Proceedings of International Joint Conference on AI. 1995, 1137–1145
- Mitchell, T. M. (1997). Machine Learning. New York: McGraw-Hill.
Details
Primary Language
Turkish
Subjects
-
Journal Section
Research Article
Publication Date
March 29, 2019
Submission Date
February 28, 2018
Acceptance Date
November 29, 2018
Published in Issue
Year 2019 Volume: 10 Number: 1
Cited By
Utilization of process network synthesis and machine learning as decision-making tools for municipal solid waste management
International Journal of Environmental Science and Technology
https://doi.org/10.1007/s13762-021-03250-0Addressing the Effectiveness of DDoS-Attack Detection Methods Based on the Clustering Method Using an Ensemble Method
Electronics
https://doi.org/10.3390/electronics11172736Asansörlerde Meydana Gelen Arıza Sebeplerinin Sınıflandırılması
Alanya Akademik Bakış
https://doi.org/10.29023/alanyaakademik.632107UTILIZATION OF SVM IN THE SOUNDNESS EVALUATION OF REINFORCED CONCRETE SLAB BRIDGE
Journal of JSCE
https://doi.org/10.2208/journalofjsce.8.1_59Türkiye’nin İthalat ve İhracatının Veri Madenciliği Yöntemleriyle Tahmini
Osmaniye Korkut Ata Üniversitesi Fen Bilimleri Enstitüsü Dergisi
https://doi.org/10.47495/okufbed.1220874Data Mining, Weka Decision Trees
Orclever Proceedings of Research and Development
https://doi.org/10.56038/oprd.v3i1.376