Sosyal medya platformları, kişisel etkileşimlerden fikir paylaşımına ve önemli uluslararası haberlerin yayılmasına kadar her türlü iletişimin birincil ortamıdır. Bununla birlikte, kullanıcılar tarafından oluşturulan metinsel bilginin sürekli artan miktarı, dilin dinamik yapısı, kullanılan ifadelerdeki ince veya gizli nüanslar ve metindeki bağlamsal bağımlılıklar, zamanında ve doğru duygu analizini giderek daha zorlu hale getirmektedir. Duygu analizi kendi başına önemli bir görevdir ve nefret söylemi ve yanlış bilgi tespiti gibi birçok diğer sınıflandırma görevinin ilk adımı olarak da kullanılır. Duygu analizi ve görüş madenciliği üzerine yapılan araştırmaların önemli bir kısmı, sosyal medya içeriklerini olumlu, olumsuz veya nötr olmak üzere üç sınıfa ayırmaya odaklanmıştır. Ancak, birçok pratik alandaki önemlerine rağmen, son derece olumsuz ve son derece olumlu duygular gibi aşırı görüşlerin sınıflandırılması ancak son zamanlarda ilgi görmeye başlamıştır. Bu boşluğu gidermek için, duygu sınıflandırması için yeni bir genetik algoritma tabanlı optimizasyon çerçevesi olan GenSent adlı bir çerçeve öneriyoruz. Genellikle belirli veri kümelerine göre uyarlanan geleneksel yöntemlerin aksine, GenSent, uç duyguları da temsil eden ikili, üçlü ve ince taneli 5 puanlık ölçek sınıflandırmasından çeşitli duygu analizi görevlerine uygulanabilen çok yönlü bir çerçeve sunar. Destek vektör makineleri, Naïve Bayes, Lojistik Regresyon, Karar Ağaçları, Rastgele Ormanlar ve Stokastik Gradyan İniş Algoritmaları dahil olmak üzere çeşitli sınıflandırıcı havuzlarının kullanımıyla GenSent, herhangi bir müdahale olmaksızın güçlü bir topluluk oluşturur. Çerçeve, ikili, üçlü ve ince taneli duygu analizi veri kümeleri, yani SemEval-2017 (Twitter'da Duygu Analizi) görevi (4A, 4B ve 4C) ve Stanford Duygu Ağaç Bankası (SST-2 ve SST-5) kullanılarak değerlendirilir. Önerilen çerçevenin performansı, aynı veri kümelerini kullanan alanda bilinen diğer mevcut yöntemlerle karşılaştırılır. Karşılaştırmalı sonuçlar, GenSent'in mevcut yöntemlerden daha iyi performans gösterdiğini, hesaplama karmaşıklığını azaltırken çeşitli metriklerde duygu sınıflandırmasında önemli iyileştirmeler sağladığını göstermektedir.
duygu analizi makine öğrenmesi optimize edilmiş topluluk sınıflandırıcı genetik optimizasyon meta-sezgisel algoritmalar.
Social media platforms are currently the primary medium of all types of communication from personal interactions, and opinion sharing to the dissemination of important international news. However, the ever-increasing amount of user-generated textual information coupled with the dynamic nature of the language, subtle or hidden nuances in expressions used, and contextual dependencies in text, renders timely and accurate sentiment analysis increasingly challenging. Sentiment analysis is an important task in its own right and is also used as the first step of many other classification tasks such as hate speech and misinformation detection. A significant portion of research on sentiment analysis and opinion mining has concentrated on categorizing social media content into three classifications: positive, negative, or neutral. However, despite their importance across numerous practical domains, the classification of extreme opinions, such as highly negative and highly positive sentiments, has only recently gained attention. To address this gap, we propose a framework, GenSent, a novel genetic algorithm-based optimization framework for sentiment classification. Unlike traditional methods that are often tailored to specific datasets, GenSent provides a versatile framework applicable to diverse sentiment analysis tasks from binary, ternary, and fine-grained 5-point scale classification that represents extreme sentiments as well. Through the use of a diverse pool of classifiers including support vector machines, Naïve Bayes, Logistic Regression, Decision Trees, Random Forests, and Stochastic Gradient Descent Algorithms, GenSent effectively builds a robust ensemble without any intervention. The framework is evaluated using binary, ternary, and fine-grained sentiment analysis datasets, namely, SemEval-2017 (Sentiment Analysis in Twitter) task (4A, 4B, and 4C) and Stanford Sentiment Treebank (SST-2 and SST-5). The performance of the proposed framework is compared with other existing well-known methods in the field using the same datasets. Comparative results demonstrate that GenSent outperforms existing methods, achieving significant improvements in sentiment classification across various metrics while reducing the computational complexity.
sentiment analysis machine learning optimized ensemble classifier genetic optimization meta-heuristic algorithms.
| Primary Language | English |
|---|---|
| Subjects | Machine Learning (Other), Computer System Software |
| Journal Section | Research Article |
| Authors | |
| Early Pub Date | October 26, 2025 |
| Publication Date | November 10, 2025 |
| Submission Date | May 25, 2025 |
| Acceptance Date | September 28, 2025 |
| Published in Issue | Year 2025 EARLY VIEW |
This work is licensed under Creative Commons Attribution-ShareAlike 4.0 International.