Twitter duygu analizinde terim ağırlıklandırma yönteminin etkisi
Abstract
Terim
ağırlıklandırma, metin sınıflandırmada sonuçlar üzerinde doğrudan etkili olan
önemli bir adımdır. Ancak, bir metin sınıflandırma problemi olarak ele alınan
duygu analizinde farklı önişleme tekniklerine bağlı olarak ağırlıklandırma
yönteminin davranışı değişebilmektedir. Bu çalışmada bilgi getirimi, metin
sınıflandırma, doküman filtreleme gibi farklı çalışma alanları için yakın
zamanda önerilen yöntemler Twitter duygu analizinde uygulanmış ve sonuçlar
üzerindeki etkisi incelenmiştir. Öznitelikler çıkarılırken kelime torbası (BoW)
ve karakter seviye N-gram olmak üzere iki farklı model kullanılmıştır. Deneyler
Türkçe ve İngilizce Twitter mesajlarından oluşan veri kümeleri üzerinde
uygulanmıştır. Twitter mesajlarının duygu sınıflandırması, Gizli Dirichlet Ataması
(LDA) tabanlı konu modeli ile gerçekleştirilmiştir. Sınıflandırma aşamasında
ise Destek Vektör Makinesi (SVM) algoritması kullanılmıştır. Deneysel sonuçlara
göre, Twitter duygu analizi çalışmalarında kullanılabilecek en etkili terim
ağırlıklandırma yöntemi önerilmiştir.
Keywords
References
- Patra A, Singh D. “A survey report on text classification with different term weighing methods and comparison between classification algorithms”. International Journal of Computer Applications, 75(7), 2013.
- Prabowo R, Thelwall M. “Sentiment analysis: A combined approach”. Journal of Informetrics, 3(2), 143-157, 2009.
- Paltoglou G, Thelwall M. “A study of information retrieval weighting schemes for sentiment analysis”. 48th Annual Meeting of the Association for Computational Linguistics, Stroudsburg, USA, 11-16 July 2010.
- Çetin M, Amasyalı MF. “Supervised and traditional term weighting methods for sentiment analysis”. In Signal Processing and Communications Applications Conference (SIU), Girne, KKTC, 24-26 April 2013.
- Aizawa A. “An information-theoretic perspective of tf–idf measures”. Information Processing & Management, 39(1), 45-65, 2003.
- Salton G, Buckley C. “Term-weighting approaches in automatic text retrieval”. Information processing & management, 24(5), 513-523, 1988.
- Robertson S, Zaragoza H, Taylor M. “Simple BM25 extension to multiple weighted fields”. 13th ACM International Conference on Information and Knowledge Management, New York, USA, 08-13 November 2004.
- Lan M, Tan CL, Low HB. “Proposing a new term weighting scheme for text categorization”. Association for the Advancement of Artificial Intelligence, Boston, USA, 16-20 June 2006.
Details
Primary Language
Turkish
Subjects
Engineering
Journal Section
Research Article
Publication Date
April 30, 2018
Submission Date
October 22, 2016
Acceptance Date
-
Published in Issue
Year 2018 Volume: 24 Number: 2