Duygu analizi için n-aşamalı Gizli Dirichlet Ayırımı ile diğer konu modelleme yöntemlerinin karşılaştırılması
Öz
Sosyal medyada yer alan paylaşımlara ait duyguları anlamak, insanların düşüncelerini öğrenmede kilit bir rol almaktadır. Gelişen teknoloji ile insanın duygusunu bilmek, çeşitli alanlarda yarar sağlamaktadır. Örneğin medya, pazarlama ve reklam gibi alanlar insanların kullanımlarına ve fikrine özgü içerikleri kullanıcıya yansıtabilme imkanı tanımaktadır. Çalışmamızda konu modelleme algoritmalarından Gizli Dirichlet Ayırımı (GDA), Gizli Anlamsal Analiz (GAA) ve Olasılıksal-Gizli Anlamsal Analiz (O-GAA) Türkçe tivitlerden kişilerin duygularını belirlemede kullanılmıştır. Ayrıca, GDA algoritmasının geliştirilen n-aşamalı halinin duygu analizindeki başarısı mevcut yöntemlerle de karşılaştırılmıştır. Kullanılan veri seti kızgın, korku, mutlu, üzgün ve şaşkın olmak üzere 5 farklı duyguya ait 4000 tivitten oluşmaktadır. Tüm konu modelleme yöntemleri 3 ve 5 sınıflı veri seti için modellenerek başarıları ve çalışma süreleri ölçülmüştür. Geliştirilen n-aşamalı GDA yönteminin, GDA ve O-GAA’ya göre çalışma süresi ve performansı açısından başarı sağladığı gözlemlenmiştir. En başarılı ve en hızlı modellenen yöntem ise GAA olmuştur.
Anahtar Kelimeler
Kaynakça
- 1. S. Lee, J. Baker, J. Song, J. C. Wetherbe, An Empirical Comparison of Four Text Mining Methods, 2010 43rd Hawaii International Conference on System Sciences, 5-8 Ocak, 2010.
- 2. Z. A. Guven, B. Diri, T. Cakaloglu, Classification of New Titles by Two Stage Latent Dirichlet Allocation, 2018 Innovations in Intelligent Systems and Applications Conference (ASYU), 4-6 Ekim, 2018.
- 3. M. A. Haidar, D. Oshaughnessy, Comparison of a bigram PLSA and a novel context-based PLSA language model for speech recognition, 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, 2013.
- 4. J. Mazarura, A. D. Waal, A comparison of the performance of latent Dirichlet allocation and the Dirichlet multinomial mixture model on short text, 2016 Pattern Recognition Association of South Africa and Robotics and Mechatronics International Conference (PRASA-RobMech), 2016.
- 5. D. M. Blei, A. Y. Ng, M. I. Jordan, Latent Dirichlet Allocation, Journal of Machine Learning Research, 3, 993-1022, 2003.
- 6. T. Kakkonen, N. Myller, E. Sutinen, J. Timonen, Comparison of Dimension Reduction Methods for Automated Essay Grading, Journal of Educational Technology & Society, 11(3), 275–288, 2008.
- 7. Y. Lu, Q. Mei, C. Zhai, Investigating task performance of probabilistic topic models: an empirical study of PLSA and LDA, Information Retrieval, 14(2), 178–203, 2010.
- 8. J.-T. Chien, C.-H. Chueh, Latent dirichlet language model for speech recognition, 2008 IEEE Spoken Language Technology Workshop, 2008.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Mühendislik
Bölüm
Araştırma Makalesi
Yazarlar
Banu Diri
0000-0002-4052-0049
Türkiye
Tolgahan Çakaloğlu
Bu kişi benim
0000-0002-4711-7287
United States
Yayımlanma Tarihi
21 Temmuz 2020
Gönderilme Tarihi
19 Nisan 2019
Kabul Tarihi
26 Mayıs 2020
Yayımlandığı Sayı
Yıl 2020 Cilt: 35 Sayı: 4
Cited By
Döküman dili tanıma için içerik bağımsız yeni bir yaklaşım: Açı Örüntüler
Gazi Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi
https://doi.org/10.17341/gazimmfd.844700Natural language based analysis of SQuAD: An analytical approach for BERT
Expert Systems with Applications
https://doi.org/10.1016/j.eswa.2022.1165921964-2022 Yılları Arasında İşletme Ana Bilim Dalı’nda Hazırlanan Tezlerin Gizli Dirichlet Tahsisi Yöntemi ile Konu Modellemesi
Anadolu Üniversitesi Sosyal Bilimler Dergisi
https://doi.org/10.18037/ausbd.1272581STACKOVERFLOW'DA "BIG DATA" İLE İLGİLİ GÖNDERİLERİN KONU MODELLEME VE BİRLİKTELİK ANALİZİ İLE ÖZELLİKLERİNİN ÇIKARILMASI
Eskişehir Osmangazi Üniversitesi Mühendislik ve Mimarlık Fakültesi Dergisi
https://doi.org/10.31796/ogummf.1375611Extended topic classification utilizing LDA and BERTopic: A call center case study on robot agents and human agents
Applied Intelligence
https://doi.org/10.1007/s10489-024-06106-5A cross-validation study of Turkish sentiment analysis datasets and tools
Language Resources and Evaluation
https://doi.org/10.1007/s10579-025-09869-6