Teknoloji, sosyal bilimler ve diğer alanlarda yapılan çalışmaların sayısı hızla artmaktadır. Bu nedenle dergilerde bulunan makalelerin sayısı da her geçen gün artış göstermektedir. Dergide bulunan makaleleri manuel olarak sınıflandırmak çok zaman almaktadır. Bu nedenle, belge seviyesinde sınıflandırma, günümüzde farklı uygulama alanlarında çok sayıda metin belgesi bulunması nedeniyle her zaman önemli bir araştırma konusu olmuştur. Bu noktada, yapılandırılmamış metin analizi yapılmalı ve sınıflandırmak için uygun yöntemler tasarlanmalıdır. Verilerin hızlı artışı nedeniyle, sınıflandırma yapmak için güçlü yöntemlere ihtiyaç duyulmaktadır. Bundan dolayı, araştırmacılar güçlü yöntemler ve algoritmalar geliştirmeye çalışmaktadırlar. Yöntemlerin ve algoritmaların başarısı, uygulanan dil, verilerin yapısı, analiz edilecek verinin uzunluğu gibi birçok faktöre bağlıdır. Çalışmamızda destek vektör makinesi (DVM), k-en yakın komşu algoritması (KNN), karar ağacı (KA) ve genetik algoritma (GA) tabanlı melez yöntemler kullanılarak Ankara Üniversitesi Siyasal Bilgiler Fakültesi Dergisi’nde bulunan bilimsel makaleler sınıflandırılmıştır. Ayrıca farklı veri kümeleri
kullanılarak önerilen yöntemler karşılaştırılmıştır. Çalışmanın sonuçları önerilen GA tabanlı yöntemlerin minimum %82.5 doğruluk oranı ile belge sınıflandırılmasında başarıyla kullanılabileceğini göstermiştir.
Metin madenciliği Belge sınıflandırması Destek vektör makinesi K-En yakın komşu algoritması Karar ağacı Genetik algoritma
Primary Language | Turkish |
---|---|
Journal Section | Research Articles |
Authors | |
Publication Date | July 1, 2022 |
Submission Date | July 10, 2020 |
Published in Issue | Year 2022 Volume: 77 Issue: 2 |