Research Article

Evrişimli Sinir Ağı Mimarilerine Dayalı Türkçe Duygu Analizi

August 15, 2020
  • Aytuğ Onan *
EN TR

Evrişimli Sinir Ağı Mimarilerine Dayalı Türkçe Duygu Analizi

Öz

Duygu analizi (görüş madenciliği), metin belgeleri içerisinde yer alan nesnelere, ürünlere, servislere ya da organizasyonlara ilişkin görüş, duygu, tutum gibi öznel bilgilerin, makine öğrenmesi, istatistik ve doğal dil işleme gibi alanlardan teknik ve yöntemlerin kullanılması ile çıkarılmasını amaçlayan bir araştırma alanıdır. Duygu analizi, yapısal olmayan bilgiden, yapısal, anlamlı ve kullanışlı bilgiler çıkarılmasını olanaklı hale getirir. Bu bilgi, karar destek sistemleri ve bireysel karar vericiler için önemli bir kaynak olarak işlev görür. Evrişimli sinir ağları, veriyi ızgara benzeri bir topoloji ile işleyen bir tür derin öğrenme yöntemidir. Bu çalışmada, Türkçe metin belgeleri üzerinde duygu analizi için, evrişimli sinir ağı tabanlı üç temel derin öğrenme mimarisinin etkinliği değerlendirilmektedir. Çalışma kapsamında önerilen birinci mimaride, gömme katmanında, metin belgesinde yer alan kelimeler için, kelime gömme yöntemleri tabanlı temsil elde edilmektedir. Ardından, evrişim katmanları yığını (1-gram, 2-gram ve 3-gram) kullanılarak 1-gram, 2-gram ve 3-gram tabanlı özniteliklerin çıkarımı gerçekleştirilmektedir. Her bir katmanda, öznitelik haritalarının oluşturulması için sabit sayıda 80 filtre uygulanmaktadır. İncelenen ikinci evrişimli sinir ağı tabanlı mimaride gömme katmanı sonucu elde edilen metin temsili, yinelenen evrişim ve maksimum havuzlama katmanlarına tabi tutulmaktadır. İncelenen üçüncü mimari ise, evrişim tabanlı piramit mimarisidir. Metin belgelerinin temsilinde, word2vec, fastText, GloVe ve LDA2vec olmak üzere dört temel kelime gömme yöntemi incelenmektedir. İncelenen evrişimli sinir ağı tabanlı mimarilerin, Türkçe duygu analizi için, geleneksel makine öğrenmesi sınıflandırıcılarına (k-en yakın komşu algoritması, destek vektör makineleri, lojistik regresyon ve Naive Bayes algoritması) ve temel derin öğrenme mimarilerine (tekrarlayan sinir ağları, uzun kısa süreli bellek birimleri ve geçitli tekrarlayan birim) kıyasla daha yüksek başarım elde ettiği görülmektedir. Word2vec (Skip-gram modeli) kelime kodlaması yöntemi ile evrişimli sinir ağı tabanlı mimari ile %92.53 doğru sınıflandırma oranı elde edilmiştir.

Anahtar Kelimeler

References

  1. Fersini, E., Messina, E., & Pozzi, F. A. (2014). Sentiment analysis: Bayesian ensemble learning. Decision support systems, 68, 26-38.
  2. Medhat, W., Hassan, A., & Korashy, H. (2014). Sentiment analysis algorithms and applications: A survey. Ain Shams engineering journal, 5(4), 1093-1113.
  3. Taboada, M., Brooke, J., Tofiloski, M., Voll, K., & Stede, M. (2011). Lexicon-based methods for sentiment analysis. Computational linguistics, 37(2), 267-307.
  4. Tan, S., & Zhang, J. (2008). An empirical study of sentiment analysis for chinese documents. Expert Systems with applications, 34(4), 2622-2629.
  5. Collobert, R., Weston, J., Bottou, L., Karlen, M., Kavukcuoglu, K., & Kuksa, P. (2011). Natural language processing (almost) from scratch. Journal of machine learning research, 12(Aug), 2493-2537.
  6. Zhang, L., Wang, S., & Liu, B. (2018). Deep learning for sentiment analysis: A survey. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 8(4), e1253.
  7. Şeker, A., Diri, B., & Balık, H. H. (2017). Derin öğrenme yöntemleri ve uygulamaları hakkında bir inceleme. Gazi Mühendislik Bilimleri Dergisi (GMBD), 3(3), 47-64.
  8. Çano, E., & Morisio, M. (2019). A data-driven neural network architecture for sentiment analysis. Data Technologies and Applications, 53(1), 2-19.

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Research Article

Authors

Aytuğ Onan * This is me
0000-0002-9434-5880
Türkiye

Publication Date

August 15, 2020

Submission Date

June 28, 2020

Acceptance Date

August 10, 2020

Published in Issue

Year 2020

APA
Onan, A. (2020). Evrişimli Sinir Ağı Mimarilerine Dayalı Türkçe Duygu Analizi. Avrupa Bilim Ve Teknoloji Dergisi, 374-380. https://doi.org/10.31590/ejosat.780609

Cited By