The data sets used in scientific studies pose a very complex structure from time to time. At this point, data mining is making a big contribution in terms of improving the quality of services by revealing useful information from large databases. Generally on studies, to predict future data trends utilization of the methods, data mining techniques in one of the most widely used are classification and regression models. In this study, among data mining methods, classification and regression models most commonly used ones are decision tree algorithms. By comparing Classification and Regression Trees (CART) algorithm which belongs to decision trees and logistic regression shows classification characteristics on real data set and success rates of these two methods. In this context, taken by the Social Security Administration pharmacy provision system, from the respiratory disease which is one of 11 diagnoses for 6,772,313 entries in the prescribed antibiotics in the penicillin group was used to analyze that profiling the patients and the analysis found the CART analysis has better classification success than logistic regression analysis
Bilimsel çalışmalarda kullanılan veri setleri zaman zaman karmaşık
bir yapı teşkil etmektedir. Bu noktada veri madenciliği, büyük veri
tabanlarından faydalı bilgileri ortaya çıkararak hizmet kalitesinin
artırılması bakımından büyük katkılar sağlamaktadır. Genellikle
araştırmalarda büyük veri kümelerini sınıflandırarak önemli veri
sınıflarını ortaya koyan veya gelecek veri eğilimlerini tahmin etmede
faydalanılan yöntemlerden, veri madenciliği teknikleri içerisinde en
yaygın kullanıma sahip olanlarından bir tanesi sınıflama ve regresyon
modelleridir. Bu çalışmada veri madenciliği metotları içerisinde,
sınıflama ve regresyon modellerinden en çok kullanılan karar ağacı
algoritmalarından biri olan sınıflama ve regresyon ağaçları (CART)
algoritması ile lojistik regresyonun sınıflama özellikleri karşılaştırılarak
gerçek bir veri seti üzerinde uygulama yapılmış ve söz konusu iki
yöntemin başarısını göstermek amaçlanmıştır. Bu sayede mevcut
veriler ile yapılan analiz sonuçlarına göre; aynı özellikte verilerle
yapılacak ileriki çalışmalarda genel geçer kurallar tanımlanmasında, söz
konusu analizleri kullanmanın uygun olacağı gösterilmek istenmiştir.
Bu kapsamda, penisilin grubu antibiyotik kullanan hastaların profilini
belirlemek amacıyla bir uygulama yapılmış ve çalışmaya alınan veri seti
için CART analizinin lojistik regresyon analizine göre daha iyi bir doğru
sınıflandırma oranına sahip olduğu görülmüştür.
Primary Language | Turkish |
---|---|
Journal Section | Makaleler |
Authors | |
Publication Date | December 1, 2014 |
Published in Issue | Year 2014 Sayı: 6 |