Bu bilimsel çalışmada, sigorta hukuk datası üzerinde karar ağacı ve rastgele orman sınıflandırıcıları kullanarak belirli parametreler özelinde performans analizi yapılması amaçlanmaktadır. Araştırma için özel bir sigorta şirketinin 15.953 adet verisi kullanılmıştır. Her iki ağaç için dallanma aşamasında gain ratio yöntemi seçilmiştir. Aynı eğitim ve test verileri modeller üzerinde ayrı ayrı uygulanmıştır. Hedef sütunun 1/4 oranında “Evet” olacak şekilde dengesiz dağılım olduğu durumda aşırı ezberlemeyi doğru algoritma ile aşabileceğini göstermiştir. Sınıflandırma aşamasında birden fazla ağaç oluşturan rastgele orman algoritması ile tek bir karar ağacı arasındaki doğruluk oranı, Cohen’s Kappa ve F-measure katsayıları karşılaştırılmış olup; rastgele orman algoritmasının 3 değerlendirme parametresi için de daha başarılı olduğu ortaya koyulmuştur. Model seçiminin anlamlı derecede performans farklılığı ortaya çıkarabileceği sonucuna ulaşılmıştır
In this scientific study, it is aimed to perform performance analysis on certain parameters by using decision tree and random forest classifiers on insurance law data. For the research, 15.953 data of a private insurance company were used. For both trees, the gain ratio method was chosen at the branching stage. The same training and test data were applied separately on the models. It has shown that if the target column has an unbalanced distribution with a ratio of 1/4 “Yes”, it can overcome overfitting with the correct algorithm. In the classification phase, the accuracy ratio, Cohen's Kappa and F-measure coefficients between the random forest algorithm that generates more than one tree and a single decision tree were compared; It has been revealed that the random forest algorithm is more successful for all 3 evaluation parameters. It has been concluded that the selection of the model may reveal a significant performance difference
Primary Language | Turkish |
---|---|
Journal Section | Research Article |
Authors | |
Publication Date | June 1, 2020 |
Published in Issue | Year 2020 Volume: 1 Issue: 13 |