Twitter duygu analizinde terim ağırlıklandırma yönteminin etkisi
Öz
Terim
ağırlıklandırma, metin sınıflandırmada sonuçlar üzerinde doğrudan etkili olan
önemli bir adımdır. Ancak, bir metin sınıflandırma problemi olarak ele alınan
duygu analizinde farklı önişleme tekniklerine bağlı olarak ağırlıklandırma
yönteminin davranışı değişebilmektedir. Bu çalışmada bilgi getirimi, metin
sınıflandırma, doküman filtreleme gibi farklı çalışma alanları için yakın
zamanda önerilen yöntemler Twitter duygu analizinde uygulanmış ve sonuçlar
üzerindeki etkisi incelenmiştir. Öznitelikler çıkarılırken kelime torbası (BoW)
ve karakter seviye N-gram olmak üzere iki farklı model kullanılmıştır. Deneyler
Türkçe ve İngilizce Twitter mesajlarından oluşan veri kümeleri üzerinde
uygulanmıştır. Twitter mesajlarının duygu sınıflandırması, Gizli Dirichlet Ataması
(LDA) tabanlı konu modeli ile gerçekleştirilmiştir. Sınıflandırma aşamasında
ise Destek Vektör Makinesi (SVM) algoritması kullanılmıştır. Deneysel sonuçlara
göre, Twitter duygu analizi çalışmalarında kullanılabilecek en etkili terim
ağırlıklandırma yöntemi önerilmiştir.
Anahtar Kelimeler
Kaynakça
- Patra A, Singh D. “A survey report on text classification with different term weighing methods and comparison between classification algorithms”. International Journal of Computer Applications, 75(7), 2013.
- Prabowo R, Thelwall M. “Sentiment analysis: A combined approach”. Journal of Informetrics, 3(2), 143-157, 2009.
- Paltoglou G, Thelwall M. “A study of information retrieval weighting schemes for sentiment analysis”. 48th Annual Meeting of the Association for Computational Linguistics, Stroudsburg, USA, 11-16 July 2010.
- Çetin M, Amasyalı MF. “Supervised and traditional term weighting methods for sentiment analysis”. In Signal Processing and Communications Applications Conference (SIU), Girne, KKTC, 24-26 April 2013.
- Aizawa A. “An information-theoretic perspective of tf–idf measures”. Information Processing & Management, 39(1), 45-65, 2003.
- Salton G, Buckley C. “Term-weighting approaches in automatic text retrieval”. Information processing & management, 24(5), 513-523, 1988.
- Robertson S, Zaragoza H, Taylor M. “Simple BM25 extension to multiple weighted fields”. 13th ACM International Conference on Information and Knowledge Management, New York, USA, 08-13 November 2004.
- Lan M, Tan CL, Low HB. “Proposing a new term weighting scheme for text categorization”. Association for the Advancement of Artificial Intelligence, Boston, USA, 16-20 June 2006.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Mühendislik
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
30 Nisan 2018
Gönderilme Tarihi
22 Ekim 2016
Kabul Tarihi
-
Yayımlandığı Sayı
Yıl 2018 Cilt: 24 Sayı: 2