Sentiment analysis is a research field that aims to identify the sentiment orientation (as, positive, negative or neutral) of a particular topic in text documents through machine learning, statistics and natural language processing techniques. Convolutional neural networks are a type of deep learning methods, which process data with a grid-like topology. In this paper, we present empirical results for three deep learning architectures based on convolutional neural network for sentiment analysis on Turkish. The first architecture initially employs word-embedding schemes to represent text documents. Then, a stack of convolution layers (i.e., 1-gram, 2-gram and 3-gram) has been employed to extract 1-gram, 2-gram and 3-gram based features. For each layer, constant number of filters have been employed to construct feature maps. The second examined architecture employs recurrent convolution and maximum pooling schemes on word embedding based representation. The third architecture is a convolution based pyramid configuration. To represent text corpus, word2vec, fastText, GloVe and LDA2vec word embedding schemes have been utilized. The empirical results on Turkish sentiment classification indicate that convolutional deep learning based architectures outperform conventional machine learning methods (such as, k-nearest neighbor algorithm, support vector machines, logistic regression and Naïve Bayes algorithm) and conventional deep learning architectures (such as, recurrent neural networks, long short term memory architecture and gated recurrent unit). We obtained a classification accuracy of 92.53% with convolutional neural network based architecture in conjuncton with word2vec (skip-gram model) based word embedding scheme.
Duygu analizi (görüş madenciliği), metin belgeleri içerisinde yer alan nesnelere, ürünlere, servislere ya da organizasyonlara ilişkin görüş, duygu, tutum gibi öznel bilgilerin, makine öğrenmesi, istatistik ve doğal dil işleme gibi alanlardan teknik ve yöntemlerin kullanılması ile çıkarılmasını amaçlayan bir araştırma alanıdır. Duygu analizi, yapısal olmayan bilgiden, yapısal, anlamlı ve kullanışlı bilgiler çıkarılmasını olanaklı hale getirir. Bu bilgi, karar destek sistemleri ve bireysel karar vericiler için önemli bir kaynak olarak işlev görür. Evrişimli sinir ağları, veriyi ızgara benzeri bir topoloji ile işleyen bir tür derin öğrenme yöntemidir. Bu çalışmada, Türkçe metin belgeleri üzerinde duygu analizi için, evrişimli sinir ağı tabanlı üç temel derin öğrenme mimarisinin etkinliği değerlendirilmektedir. Çalışma kapsamında önerilen birinci mimaride, gömme katmanında, metin belgesinde yer alan kelimeler için, kelime gömme yöntemleri tabanlı temsil elde edilmektedir. Ardından, evrişim katmanları yığını (1-gram, 2-gram ve 3-gram) kullanılarak 1-gram, 2-gram ve 3-gram tabanlı özniteliklerin çıkarımı gerçekleştirilmektedir. Her bir katmanda, öznitelik haritalarının oluşturulması için sabit sayıda 80 filtre uygulanmaktadır. İncelenen ikinci evrişimli sinir ağı tabanlı mimaride gömme katmanı sonucu elde edilen metin temsili, yinelenen evrişim ve maksimum havuzlama katmanlarına tabi tutulmaktadır. İncelenen üçüncü mimari ise, evrişim tabanlı piramit mimarisidir. Metin belgelerinin temsilinde, word2vec, fastText, GloVe ve LDA2vec olmak üzere dört temel kelime gömme yöntemi incelenmektedir. İncelenen evrişimli sinir ağı tabanlı mimarilerin, Türkçe duygu analizi için, geleneksel makine öğrenmesi sınıflandırıcılarına (k-en yakın komşu algoritması, destek vektör makineleri, lojistik regresyon ve Naive Bayes algoritması) ve temel derin öğrenme mimarilerine (tekrarlayan sinir ağları, uzun kısa süreli bellek birimleri ve geçitli tekrarlayan birim) kıyasla daha yüksek başarım elde ettiği görülmektedir. Word2vec (Skip-gram modeli) kelime kodlaması yöntemi ile evrişimli sinir ağı tabanlı mimari ile %92.53 doğru sınıflandırma oranı elde edilmiştir.
Primary Language | Turkish |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors | |
Publication Date | August 15, 2020 |
Published in Issue | Year 2020 Ejosat Special Issue 2020 (HORA) |