Günümüzde gittikçe yaygınlaşan sosyal medya kullanımı ile duygular ve fikirler bu platformlar üzerinden ifade edilmektedir. Bu platformlarda paylaşılan fikirler ile büyük miktarda veri ortaya çıkmaktadır. Bu verilerin sınıflandırılmasının ve analizinin manuel olarak yapılması büyük bir iş gücü gerektirdiğinden bazı algoritmalar ile duygu analizi yapılması gereksinimi ortaya çıkmıştır. Bu çalışmada çeşitli platformlardan alınan beş farklı veri kümesi ve her bir veri kümesi için dört farklı makine öğrenmesi algoritması(KNN, Naif Bayes, Rastgele Orman, DVM) kullanılmıştır. Çalışma sonucunda DVM algoritması ile veri setlerinin genelinde daha doğru sonuçlar, Rastgele Orman ve Naif Bayes algoritmaları ile veri setleri ve eğitim yüzdelerine göre değişken sonuçlar elde edilmiştir. KNN algoritması ile veri setlerinin genelinde doğruluğu en düşük sonuçlar elde edilmiştir.
Duygu Analizi Makine Öğrenmesi Sosyal Medya Analizi Sınıflandırma Metin madenciliği
TÜBİTAK
118E315, 120E187
Bu çalışma kısmen 118E315 numaralı ve 120E187 numaralı araştırma projeleri aracılığıyla Türkiye Bilimsel ve Teknolojik Araştırma Kurumu (TÜBİTAK) tarafından desteklenmektedir. Bu belgedeki görüşler yazarlara aittir ve TÜBİTAK'ın resmi pozisyonunu veya politikalarını temsil etmeyebilir.
Recently, with the use of social media, which is becoming more and more widespread today, emotions and ideas are expressed through these platforms. Huge amounts of data emerge with ideas shared on these platforms. Since the classification and analysis of these data requires a large labor force, the need for sentiment analysis with some algorithms has emerged. In this study, five different datasets from various platforms and four different machine learning algorithms (kNN, Naive Bayes, Random Forest, SVM) were used for each dataset. As a result of the study, more accurate results were obtained in general with the SVM algorithm, and variable results were obtained with the Random Forest and Naive Bayes algorithms according to the data sets and training percentages. With the KNN algorithm, the lowest accuracy results were obtained across the data sets.
Sentiment Analysis Machine Learning Social Media Analysis Classification Text Mining Sentiment Analysis, Machine Learning, Social Media Analysis, Classification, Text Mining
118E315, 120E187
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Proje Numarası | 118E315, 120E187 |
Yayımlanma Tarihi | 30 Kasım 2021 |
Yayımlandığı Sayı | Yıl 2021 |