Sınıflandırma, istatistik, bilgisayar bilimi, matematik ve diğer birçok disiplin arasında veri madenciliği ile ortak bir alan yaratır. Bağımlı ve bağımsız değişkenler arasındaki ilişkiyi sınıflandırmak için sıklıkla kullanılan parametrik ve parametrik olmayan pek çok istatistiksel uygulamalar bulunmaktadır. Bu çalışmada yaygın olarak kullanılan iki sınıflandırma tekniği kullanılmıştır. Çalışmanın amacı, sıralı lojistik regresyon ve sınıflandırma ağaçları tekniklerinin sınıflandırma başarısını karşılaştırmaktır. Bu amaçla, Eskişehir’ de üç sınıflı bağımlı değişken olarak ele alınan konut birim fiyatlarını konut birim fiyatlarını etkileyen potansiyel faktörler incelenmiştir. Gerçek veri seti, eğitim, doğrulama ve test olmak üzere üç gruba bölünmüştür. Bu tekniklerin sınıflandırma başarısı, 5 katlı çapraz geçerlilik ile gösterilmiştir. Elde edilen sonuçlara göre, daha başarılı bir sınıflandırma, sınıflandırma ağaçları algoritmasıyla elde edilmiştir.
In data mining, classification builds an interdisciplinary field upon from statistics, computer science, mathematics and many other disciplines. There are numerous statistical applications where parametric and non-parametric methods are frequently used to train data to estimate mapping function. In this study, two of the most widely used techniques are applied to a real dataset. The goal of the study is to compare the classification success of ordinal logistic regression and the classification trees and to predict a categorical response. For this purpose, the potential factors affecting the housing unit price for sale as being the dependent variable with three classes in Eskişehir were examined. The real data set was split into three as train, validation and test groups. The classification performance of the techniques was demonstrated with 5-fold cross validation technique. According to the results, a more successful classification was made with the classification trees algorithm.
Primary Language | English |
---|---|
Subjects | Engineering |
Journal Section | Makaleler |
Authors | |
Publication Date | December 20, 2022 |
Published in Issue | Year 2022 Volume: 26 Issue: 3 |
e-ISSN :1308-6529
Linking ISSN (ISSN-L): 1300-7688
All published articles in the journal can be accessed free of charge and are open access under the Creative Commons CC BY-NC (Attribution-NonCommercial) license. All authors and other journal users are deemed to have accepted this situation. Click here to access detailed information about the CC BY-NC license.