Bu araştırmanın birinci amacı çeşitli çekirdek fonksiyonlarıyla oluşturulan destek vektör makineleri DVM yardımıyla ve farklı dallanma kriterleriyle oluşturulan Random Forest RF yöntemleriyle hidrosefaliye sahip olan ve olmayan hasta bebekleri sınıflandırmaktır. Bu çalışmada incelenen veriler, İnönü Üniversitesi Turgut Özal Tıp Merkezi Pediatri Anabilim Dalı veri tabanından geriye yönelik retrospektif olarak seçilmiştir. Çalışmada yer alan veriler hidrosefalisi olan ve olmayan bebekleri ve bu bebeklere ilişkin diğer özellikleri içermektedir. Hidrosefalinin sınıflandırılması işlemi için DVM ve RF modelleri kullanılmıştır. Performans değerlendirmesinde doğruluk, sınıflama hatası, kappa istatistiği, ROC eğrisi altında kalan alan AUC , f ölçümü, duyarlılık, seçicilik ve Youden indeksi ölçütleri kullanılmıştır. DVM modellerinden en iyi sınıflandırma performansını gösteren ANOVA çekirdeğine ilişkin performans ölçütlerine ait değerler %95 güven aralığında sırasıyla; doğruluk için %72.14±8.99, sınıflama hatası için %27.86±8.99, kappa istatistiği için 0.424±0.209, AUC için 0.748±0.120, f ölçümü için %75.78±6.97, duyarlılık için %71.45±8.27, seçicilik için %73.00±22.13, Youden indeksi için 0.444±0.221 olarak elde edilmiştir. RF modellerinden en iyi sınıflandırma performansını gösteren Gini İndeksi ile oluşturulan modele ilişkin performans ölçütlerine ait değerler sırasıyla; doğruluk için %77.47±9.51, sınıflama hatası için %22.53±9.51, kappa istatistiği için 0.554±0.193, AUC için 0.799±0.100, f ölçümü için %78.89±9.43, duyarlılık için %71.90±15.10, seçicilik için %87.00±19.23, Youden indeksi için 0.589±0.197 olarak elde edilmiştir. Hidrosefaliyi sınıflandırmada en iyi performansı RF modeli vermiştir. İlerleyen çalışmalarda, hidrosefalinin sınıflandırma performansını arttırmak için gelişmiş makine öğrenmesi yöntemleri kullanılacaktır
The first objective of this research is to classify babies with and without hydrocephalus by means of support vector machines SVM constructed by various kernel functions and Random Forest RF methods generated by different branching criteria. The data analyzed in this study were retrospectively selected from the database of the Department of Pediatric, Turgut Özal Medical Center, Inonu University. The data included in the study include babies with and without hydrocephalus and risk factors related to these babies. SVM and RF models were used for classification of hydrocephalus. As performance evaluation metrics; accuracy, classification error, kappa statistic, area under the ROC curve AUC , f-measure, sensitivity, specificity and Youden index were used. For SVM models, the best classification performances were obtained by the SVM with ANOVA kernel model. The performance metrics with 95% confidence interval were respectively; 72.14% ± 8.99 for accuracy, 27.86% ± 8.99 for classification error, 0.424 ± 0.209 for kappa statistic, 0.748 ± 0.120 for AUC, 75.78% ± 6.97 for f measurement, 71.45% ± 8.27 for sensitivity, 73.00% ± 22.13 and 0.404 ± 0.221 for Youden index. For RF models, the best classification performances were obtained by RF constructed by the Gini Index. The performance metrics with 95% confidence interval were respectively; 77.47% ± 9.51 for accuracy, 22.53% ± 9.51 for classification error, 0.554 ± 0.193 for kappa statistic, 0.799 ± 0.100 for AUC, 78.89% ± 9.43 for f measurement, 71.90%± 15.10 for sensitivity, 87.00% ± 19.23 and 0.589 ± 0.197 for Youden index. The best classification performance to predict Hydrocephalic achieved by RF model. As future study, more sophisticate machine learning algorithms will be used to improve classification performance of the Hydrocephalic
Primary Language | Turkish |
---|---|
Journal Section | Research Article |
Authors | |
Publication Date | October 1, 2018 |
Published in Issue | Year 2018 Volume: 7 Issue: 2 |