Bu çalışmada, FATİH projesine
yönelik internet ortamında yer alan görüşlerin metin madenciliği yöntemleri ile
otomatik tespitinin yapılması amaçlanmaktadır. Çalışma iki temel kısımdan
meydana gelmektedir. İlk basamakta, internet ortamındaki yapısal olmayan veri
kümelerinin yapısal veri haline dönüştürülmesini sağlamak amacıyla metin
madenciliği veri önişleme yazılımı geliştirilmiştir. İkinci basamakta ise
geliştirilen metin madenciliği veri önişleme yazılımı ile yapısal veri kümesine
dönüştürülen veriler üzerinde makine öğrenmesi algoritmaları uygulanarak
yorumlar otomatik sınıflandırılmaktadır. Geliştirilen metin madenciliği veri
önişleme yazılımının en önemli ayırt edici özelliği, yazılımın sadece FATİH
projesine yönelik görüşlerinin veri önişleme basamağında değil, istenilen amaca
yönelik metin sınıflandırma işleminin veri önişleme basamağında konudan
bağımsız bir şekilde kullanılabilir olmasıdır. Çalışmada FATİH projesine
yönelik 444 görüş içeren metin dosyasındaki metinler tf-idf ağırlıklandırma
yöntemi ile vektörel olarak temsil edilerek sınıflandırma algoritmalarının
model başarım ölçütleri karşılaştırılmıştır. Performansı karşılaştırılan
algoritmalardan en yüksek başarımın Ardışık Minimal Optimizasyon Algoritmasına
ait olduğu (%88,73) gözlemlenmiştir.
Metin madenciliği FATİH projesi metin sınıflandırma fikir madenciliği ardışık minimal optimizasyon algoritması
Konular | Bilgisayar Yazılımı |
---|---|
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 31 Temmuz 2017 |
Gönderilme Tarihi | 2 Şubat 2017 |
Yayımlandığı Sayı | Yıl 2017 Cilt: 10 Sayı: 3 |