Fikir madenciliği ya da diğer adıyla duygu analizi, metin verilerinde ifade edilen görüşleri, duyguları, tutumları ve hisleri analiz etmeye ve anlamaya odaklanan Doğal Dil İşlemenin (NLP) bir dalıdır. Fikir madenciliğinin amacı, bir inceleme, yorum veya sosyal medya gönderisi gibi belirli bir metin parçasının duygu kutupluluğunu belirlemektir. Ancak görüş madenciliği, daha az araştırılmış dillerdeki çalışmaları İngilizce yapılan çalışmalardan ayıran dile özgü zorluklarla karşı karşıyadır. Bu makale, çeşitli yapay zekâ algoritmalarını karşılaştırarak Türkçe fikir madenciliği için yeni bir süreç sunmaktadır. Şeffaflık ve yeniden üretilebilirliği sağlamak için açık kaynaklı bir Türkçe görüş madenciliği veri kümesi kullanarak kapsamlı deneyler yürüttük. Araştırmamızda geleneksel makine öğrenimi, derin öğrenmeye dayalı algoritmalar ve önceden eğitilmiş dönüştürücü modelleri değerlendirerek parametrelerini optimize etmeye odaklandık. Ayrıca kelime yerleştirmelerini geleneksel kelime torbası yöntemiyle karşılaştırdık. Hiper parametreler optimize ederek, model doğrulukları ve F1 puanları önemli ölçüde iyileştirildi. Önerilen süreç, literatürdeki mevcut yöntemlerden daha iyi performans göstererek, fikir madenciliği alanında gelecekteki araştırmalar için değerli bilgiler sağlamıştır.
Fikir madenciliği doğal dil işleme makine ögrenmesi derin ögrenme ön-eğitimli dil modelleri dönüştürücü algoritmaları
Opinion mining, aka sentiment analysis, is a branch of Natural Language Processing (NLP) that focuses on analyzing and understanding opinions, sentiments, attitudes, and emotions expressed in text data. The goal of opinion mining is to determine the sentiment polarity of a given piece of text, such as a review, comment, or social media post. However, opinion mining faces language-specific challenges that differentiate studies in less commonly researched languages from those conducted in English. This article presents a novel process for Turkish opinion mining by comparing various artificial intelligence algorithms. We conducted extensive experiments using an open-source Turkish opinion-mining dataset to ensure transparency and reproducibility. Our research evaluated traditional machine learning, deep learning-based algorithms, and pre-trained transformer models, focusing on optimizing their parameters. We also compared word embeddings with the traditional bag-of-words method. By fine-tuning hyperparameters, our optimized models significantly improved accuracy and F1 scores. The proposed process outperformed existing methods in the literature, providing valuable insights for future research in opinion mining.
Opinion mining natural language processing machine learning deep learning pre-trained language models transformer models
Birincil Dil | İngilizce |
---|---|
Konular | Doğal Dil İşleme |
Bölüm | PAPERS |
Yazarlar | |
Erken Görünüm Tarihi | 24 Aralık 2024 |
Yayımlanma Tarihi | 25 Aralık 2024 |
Gönderilme Tarihi | 7 Eylül 2024 |
Kabul Tarihi | 21 Aralık 2024 |
Yayımlandığı Sayı | Yıl 2024 |
The Creative Commons Attribution 4.0 International License is applied to all research papers published by JCS and
a Digital Object Identifier (DOI) is assigned for each published paper.