TWITTER MESAJLARI ÜZERINDE MAKİNE ÖĞRENMESİ YÖNTEMLERİNE DAYALI DUYGU ANALİZİ
Öz
Twitter, insanların
güncel konular hakkında görüş bildirdikleri önemli bir sosyal mecradır. Twitter
kullanıcılarının yaptıkları paylaşım ve görüş bildirimleri, araştırmacı ve
uygulayıcılar için önemli bir bilgi kaynağı olarak işlev görmektedir. Twitter
verileri, güncel olayları belirleme, yaygın hastalıklar hakkında bilgi toplama,
kriz yönetimi gibi birçok farklı alanda kullanılabilmektedir. Duygu analizi,
doğal dil işleme, istatistik, bilgisayar bilimleri gibi alanlardan yöntem ve
tekniklerin kullanılması ile görüş sahibinin metin içerisinde belirttiği,
duygu, görüş, tutum gibi öznel bilgilerin belirlenmesini amaçlayan güncel bir
araştırma alanıdır. Makine öğrenmesi sınıflandırıcıları, aralarında duygu
analizinin de yer aldığı, metin madenciliği ve web madenciliğine ilişkin birçok
alanda başarıyla uygulanmaktadır. Metin sınıflandırıcılarının başarımlarında,
ham metin belgelerinin temsil edilmesinde kullanılan öznitelikler büyük önem
taşımaktadır. Bu doğrultuda, bu çalışma kapsamında Türkçe Twitter mesajlarının
sınıflandırılmasında, üç temel makine öğrenmesi sınıflandırıcısı (Naive Bayes
algoritması, destek vektör makineleri, lojistik regresyon) kullanılmıştır.
Metin temsilinde, farklı öznitelik temsili (1-gram, 2-gram ve 3-gram) ve bu
öznitelik temsilleri ile elde edilen farklı öznitelik setleri
değerlendirilmiştir.
Anahtar Kelimeler
Kaynakça
- Agarwal, A., Xie, B., Vovsha, I., Rambow, O., & Passonneau, R. (2011, June). Sentiment analysis of twitter data. In Proceedings of the workshop on languages in social media (pp. 30-38). Association for Computational Linguistics.
- Aggarwal, C. C., & Zhai, C. (2012). A survey of text classification algorithms. In Mining text data (pp. 163-222). Springer US.
- Akgül, E.S., Ertano, C., & Diri, B. (2016). Twitter verileri ile duygu analizi. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, 22(2), 106-110.
- Bermingham, A., & Smeaton, A. F. (2010, October). Classifying sentiment in microblogs: is brevity an advantage?. In Proceedings of the 19th ACM international conference on Information and knowledge management (pp. 1833-1836). ACM.
- Cheng, Z., Caverlee, J., & Lee, K. (2010, October). You are where you tweet: a content-based approach to geo-locating twitter users. In Proceedings of the 19th ACM international conference on Information and knowledge management (pp. 759-768). ACM.
- Çoban, Ö., Özyer, B., & Özyer, G. T. (2015, May). Sentiment analysis for Turkish Twitter feeds. In Signal Processing and Communications Applications Conference (SIU), 2015 23th (pp. 2388-2391). IEEE.
- Go, A., Bhayani, R., & Huang, L. (2009). Twitter sentiment classification using distant supervision. CS224N Project Report, Stanford, 1(12).
- Han, J., Pei, J., & Kamber, M. (2011). Data mining: concepts and techniques. Elsevier.
Ayrıntılar
Birincil Dil
Türkçe
Konular
-
Bölüm
Araştırma Makalesi
Yazarlar
Aytuğ Onan
*
CELÂL BAYAR ÜNİVERSİTESİ
Türkiye
Yayımlanma Tarihi
20 Aralık 2017
Gönderilme Tarihi
16 Kasım 2017
Kabul Tarihi
23 Kasım 2017
Yayımlandığı Sayı
Yıl 2017 Cilt: 3 Sayı: 2