İnternetin gelişmesiyle birlikte kullanım oranı
her geçen gün artan sosyal ağlar kirli ve düzensiz verilerin bulunduğu ortamlar
haline gelmiştir. Verileri düzenleyen ve analiz eden sistemler oluşturabilmek
amacıyla bu makalede, twitter sosyal ağından elde edilen Türkçe tweetlerden
duygu çıkarımı yapılarak tweetlerin olumlu, olumsuz, nötr olarak sınıflandırılması
sunulmuştur. Twitter üzerinden çekilen 20000 verinin sözlük tabanlı doğal dil
işleme modeli ile kelimelerin sayısını temel alan özellik vektörleri elde
edilmiştir, Elde edilen tweetlerin 14471
adedi gönüllü bireyler tarafından etiketlenip %60’ı
eğitim %40’ı test verisi olarak kullanılmıştır. Test verisinin sınıflandırılması
DVM, Naïve Bayes ve Karar Ağacına göre yapılmıştır. Elde edilen sonuçlara göre
en yüksek doğruluk oranı Karar Ağacı ile elde edilmiştir.
Birincil Dil | Türkçe |
---|---|
Bölüm | PAPERS |
Yazarlar | |
Yayımlanma Tarihi | 1 Haziran 2019 |
Gönderilme Tarihi | 31 Ekim 2018 |
Kabul Tarihi | 19 Aralık 2018 |
Yayımlandığı Sayı | Yıl 2019 Cilt: 4 Sayı: 1 |
The Creative Commons Attribution 4.0 International License is applied to all research papers published by JCS and
a Digital Object Identifier (DOI) is assigned for each published paper.