Araştırma Makalesi
BibTex RIS Kaynak Göster

Duygu Analizi İçin Veri Madenciliği Sınıflandırma Algoritmalarının Karşılaştırılması

Yıl 2021, , 880 - 889, 30.11.2021
https://doi.org/10.31590/ejosat.905259

Öz

Teknolojinin gelişmesi, internetin yaygınlaşması ve internet aracılığıyla bilgiye erişim kolaylığı insanların duygu ve düşüncelerini farklı iletişim araçlarını kullanarak paylaşmalarına imkân sağlamaktadır. Uyarlanabilir öğrenme ve karar verebilme gibi yeteneklerle donatılarak daha akıllı hale gelen söz konusu bu iletişim araçları, her geçen gün daha geniş kitlelere ulaşmaktadır. Bir zamanlar sadece ses iletimi için kullanılan bu araçlar şimdilerde insanların forum ve blog gibi sanal ortamlarda duygu ve düşüncelerini yazılı olarak paylaşmalarını mümkün kılmaktadır. Sanal ortamlar aracılığıyla yapılan bu yorumlar artık bir bilgi edinme kaynağı olarak görülmekte ve daha da önemlisi bu yorumlar bireylerin farklı konulara ilişkin düşüncelerinin analiz edilebilmelerini kolaylaştırdıkları için konu üzerinde çalışmalar yürüten araştırmacıların dikkatini fazlasıyla çekmektedir. Başka bir deyişle bu yorumlardan günümüzün popüler bir araştırma alanı olan duygu analizi için gerçek bir veri seti olarak faydalanılmaktadır. Bu çalışmada ürün, film ve restoran yorumlarını içeren farklı veri setlerinden faydalanılarak veri madenciliği sınıflandırma algoritmaları yardımıyla duygu analizi yapılmıştır. Bu amaçla Destek Vektör Makinesi, K-En Yakın Komşu, Naive Bayes, Karar Ağacı ve Rastgele Orman sınıflandırma algoritmalarından faydalanılmıştır. Veri boyutunu ve çeşitliliğini arttırmak amacıyla her biri içerisinde 500 olumlu, 500 olumsuz olmak üzere toplamda 1000 adet yorum içeren üç farklı veri seti birleştirilmiştir. Deneysel sonuçlar Destek Vektör Makinesi sınıflandırma algoritmasının duygu analizi noktasında diğer yöntemlere kıyasla daha başarılı olduğunu göstermiştir.

Kaynakça

  • Aksu, G., & Dogan, N. (2019). Comparison of Decision Trees Used in Data Mining= Veri madenciliginde kullanilan karar agaçlarinin karsilastirilmasi. Pegem Journal of Education and Instruction, 9(4), 1183-1208.
  • Albayrak, M., Topal, K., Altıntaş, V. (2017). Sosyal Medya Üzerinde Veri Analizi: Twitter. Süleyman Demirel Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 22(Kayfor 15 Özel Sayısı), 1991-1998.
  • Anonim (2020). Internet: UCI ML Repository Sentiment Analysis Dataset, http://archive.ics.uci.edu/ml/datasets/Sentiment+Labelled+Sentences, Son Erişim Tarihi: 28.03.2021.
  • Aydın, C. (2018). Makine öğrenmesi algoritmaları kullanılarak itfaiye istasyonu ihtiyacının sınıflandırılması. Avrupa Bilim ve Teknoloji Dergisi, (14), 169-175.
  • Balahur, A., Hermida, J. M., Montoyo, A. (2012). Detecting implicit expressions of emotion in text: A comparative analysis. Decision Support Systems, 53(4), 742-753.
  • Burcu, A. K. I. N., Şimşek, U. T. G. (2018). Sosyal Medya Analitiği İle Değer Yaratma: Duygu Analizi İle Geleceğe Yönelim. Mehmet Akif Ersoy Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 5(3), 797-811.
  • Coşkun, C., & Baykal, A. (2011). Veri madenciliğinde sınıflandırma algoritmalarının bir örnek üzerinde karşılaştırılması. Akademik Bilişim, 2011, 1-8.
  • Demir, C. G., Yılmaz, H. (2018). Sınıf dışı eğitim faaliyetlerinin öğrencilerin bilim ve teknolojiye yönelik tutumlarına etkisi ve duygu analizi. İnsan ve Toplum Bilimleri Araştırmaları Dergisi, 7(5), 101-116.
  • Güran, A., & Kınık, D. (2021). TF-IDF ve Doc2Vec Tabanlı Türkçe Metin Sınıflandırma Sisteminin Başarım Değerinin Ardışık Kelime Grubu Tespiti ile Arttırılması. Avrupa Bilim ve Teknoloji Dergisi, (21), 323-332.
  • Kalaycı, T. E. (2018). Kimlik hırsızı web sitelerinin sınıflandırılması için makine öğrenmesi yöntemlerinin karşılaştırılması. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, 24(5), 870-878.
  • Kaynar, O., Yıldız, M., Görmez, Y., & Albayrak, A. (2016). td öğrenmesi yöntemleri ile Duygu Analizi. In International Artificial Intelligence and Data Processing Symposium (IDAP'16) (pp. 17-18).
  • Khan, F. H., Qamar, U., & Bashir, S. (2016). eSAP: A decision support framework for enhanced sentiment analysis and polarity classification. Information Sciences, 367, 862-873.
  • Kotzias, D., Denil, M., De Freitas, N., & Smyth, P. (2015, August). From group to individual labels using deep features. In Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp. 597-606).
  • Kılınç, D., Borandağ, E., Yücalar, F., Tunali, V., Şimşek, M., & Özçift, A. (2016). KNN algoritması ve r dili ile metin madenciliği kullanılarak bilimsel makale tasnifi. Marmara Fen Bilimleri Dergisi, 28(3), 89-94.
  • Liu, H., & Zhang, S. (2012). Noisy data elimination using mutual k-nearest neighbor for classification mining. Journal of Systems and Software, 85(5), 1067-1074.
  • Nalçakan, Y., Bayramoğlu, Ş. S., & Tuna, S. (2015). Sosyal Medya Verileri Üzerinde Yapay Öğrenme ile Duygu Analizi Çalışması. Technical Report.
  • Onan, A., & Korukoğlu, S. (2016). Makine öğrenmesi yöntemlerinin görüş madenciliğinde kullanılması üzerine bir literatür araştırması. Pamukkale University Journal of Engineering Sciences, 22(2).
  • Orakcı, M., Ciylan, B., Kök, İ., & Sevri, M. (2019). Suç Analizinde Veri Madenciliği Teknikleri Ve Makine Öğrenmesi Algoritmalarının Kullanılması.
  • Osowski, S., Siwek, K., & Markiewicz, T. (2004, June). Mlp and svm networks-a comparative study. In Proceedings of the 6th Nordic Signal Processing Symposium, 2004. NORSIG 2004. (pp. 37-40). IEEE.
  • Pang, B., Lee, L., & Vaithyanathan, S. (2002). Thumbs up? Sentiment classification using machine learning techniques. arXiv preprint cs/0205070.
  • Parlar, T., Saraç, E., & Özel, S. A. (2017, May). Comparison of feature selection methods for sentiment analysis on Turkish Twitter data. In 2017 25th Signal Processing and Communications Applications Conference (SIU) (pp. 1-4). IEEE.
  • Seker, S. E. (2016). Duygu Analizi (Sentimental Analysis). YBS Ansiklopedi, 3(3), 21-36.
  • Şentürk, A. (2006). Veri madenciliği: kavram ve teknikler. Ekin Yayınevi.
  • Taşçı, M. E., & Şamlı, R. (2020). Veri Madenciliği İle Kalp Hastalığı Teşhisi. Avrupa Bilim ve Teknoloji Dergisi, 88-95.
  • Topaçan, Ü. (2016). Sosyal medya paylaşımlarında duygu analizi: makine öğrenimi yaklaşımı üzerine bir araştırma. Doktora Tezi, Marmara Üniversitesi Sosyal Bilimler Enstitüsü, İstanbul, 1-216.
  • Uçkan, T., Cengiz, H. A. R. K., Seyyarer, E., & Karcı, A. Ağırlıklandırılmış Çizgelerde Tf-Idf ve Eigen Ayrışımı Kullanarak Metin Sınıflandırma. Bitlis Eren Üniversitesi Fen Bilimleri Dergisi, 8(4), 1349-1362.
  • Varol, A. B., & İşeri, İ. (2019). Lenf Kanserine İlişkin Patoloji Görüntülerinin Makine Öğrenimi Yöntemleri ile Sınıflandırılması. Avrupa Bilim ve Teknoloji Dergisi, 404-410.
  • Zhang, L., Hua, K., Wang, H., Qian, G., & Zhang, L. (2014). Sentiment analysis on reviews of mobile users. Procedia Computer Science, 34, 458-465.
  • Wu, J., Cai, Z., & Zhu, X. (2013, August). Self-adaptive probability estimation for naive bayes classification. In The 2013 International Joint Conference on Neural Networks (IJCNN) (pp. 1-8). IEEE.

Comparison of Data Mining Classification Algorithms for Sentiment Analysis

Yıl 2021, , 880 - 889, 30.11.2021
https://doi.org/10.31590/ejosat.905259

Öz

The development of technology, the spread of the Internet and the ease of access to the information through the Internet enable people to share their feelings and thoughts using different communication channels. These communication mediums, that have become smarter by being equipped with the skills such as the adaptive learning and decision making, are reaching a wider audience day by day. While these channels were once used only for the voice transmission, it nowadays enables people to share their feelings and thoughts in the virtual environments such as forums and blogs. The comments made through the virtual environments are now seen as a source of information, and more importantly, these comments attract the attention of researchers who are working on the subject, as they facilitate the analysis of individuals' opinions on different topics. In other words, these comments are used as a real data set for the sentiment analysis, that is one of the popular research areas. In this study, the sentiment analysis was carried out by means of the data mining classification algorithms applied on different data sets including the product, movie and restaurant reviews. For this purpose, Support Vector Machine, K-Nearest Neighbor, Naive Bayes, Decision Tree and Random Forest classification algorithms were taken into consideration. In order to increase the data size and its diversity, three different data sets, each containing 500 positive and 500 negative, 1000 comments in total, were combined. Experimental results showed that the Support Vector Machine classification algorithm is more successful than other methods in the sentiment analysis.

Kaynakça

  • Aksu, G., & Dogan, N. (2019). Comparison of Decision Trees Used in Data Mining= Veri madenciliginde kullanilan karar agaçlarinin karsilastirilmasi. Pegem Journal of Education and Instruction, 9(4), 1183-1208.
  • Albayrak, M., Topal, K., Altıntaş, V. (2017). Sosyal Medya Üzerinde Veri Analizi: Twitter. Süleyman Demirel Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 22(Kayfor 15 Özel Sayısı), 1991-1998.
  • Anonim (2020). Internet: UCI ML Repository Sentiment Analysis Dataset, http://archive.ics.uci.edu/ml/datasets/Sentiment+Labelled+Sentences, Son Erişim Tarihi: 28.03.2021.
  • Aydın, C. (2018). Makine öğrenmesi algoritmaları kullanılarak itfaiye istasyonu ihtiyacının sınıflandırılması. Avrupa Bilim ve Teknoloji Dergisi, (14), 169-175.
  • Balahur, A., Hermida, J. M., Montoyo, A. (2012). Detecting implicit expressions of emotion in text: A comparative analysis. Decision Support Systems, 53(4), 742-753.
  • Burcu, A. K. I. N., Şimşek, U. T. G. (2018). Sosyal Medya Analitiği İle Değer Yaratma: Duygu Analizi İle Geleceğe Yönelim. Mehmet Akif Ersoy Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 5(3), 797-811.
  • Coşkun, C., & Baykal, A. (2011). Veri madenciliğinde sınıflandırma algoritmalarının bir örnek üzerinde karşılaştırılması. Akademik Bilişim, 2011, 1-8.
  • Demir, C. G., Yılmaz, H. (2018). Sınıf dışı eğitim faaliyetlerinin öğrencilerin bilim ve teknolojiye yönelik tutumlarına etkisi ve duygu analizi. İnsan ve Toplum Bilimleri Araştırmaları Dergisi, 7(5), 101-116.
  • Güran, A., & Kınık, D. (2021). TF-IDF ve Doc2Vec Tabanlı Türkçe Metin Sınıflandırma Sisteminin Başarım Değerinin Ardışık Kelime Grubu Tespiti ile Arttırılması. Avrupa Bilim ve Teknoloji Dergisi, (21), 323-332.
  • Kalaycı, T. E. (2018). Kimlik hırsızı web sitelerinin sınıflandırılması için makine öğrenmesi yöntemlerinin karşılaştırılması. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, 24(5), 870-878.
  • Kaynar, O., Yıldız, M., Görmez, Y., & Albayrak, A. (2016). td öğrenmesi yöntemleri ile Duygu Analizi. In International Artificial Intelligence and Data Processing Symposium (IDAP'16) (pp. 17-18).
  • Khan, F. H., Qamar, U., & Bashir, S. (2016). eSAP: A decision support framework for enhanced sentiment analysis and polarity classification. Information Sciences, 367, 862-873.
  • Kotzias, D., Denil, M., De Freitas, N., & Smyth, P. (2015, August). From group to individual labels using deep features. In Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp. 597-606).
  • Kılınç, D., Borandağ, E., Yücalar, F., Tunali, V., Şimşek, M., & Özçift, A. (2016). KNN algoritması ve r dili ile metin madenciliği kullanılarak bilimsel makale tasnifi. Marmara Fen Bilimleri Dergisi, 28(3), 89-94.
  • Liu, H., & Zhang, S. (2012). Noisy data elimination using mutual k-nearest neighbor for classification mining. Journal of Systems and Software, 85(5), 1067-1074.
  • Nalçakan, Y., Bayramoğlu, Ş. S., & Tuna, S. (2015). Sosyal Medya Verileri Üzerinde Yapay Öğrenme ile Duygu Analizi Çalışması. Technical Report.
  • Onan, A., & Korukoğlu, S. (2016). Makine öğrenmesi yöntemlerinin görüş madenciliğinde kullanılması üzerine bir literatür araştırması. Pamukkale University Journal of Engineering Sciences, 22(2).
  • Orakcı, M., Ciylan, B., Kök, İ., & Sevri, M. (2019). Suç Analizinde Veri Madenciliği Teknikleri Ve Makine Öğrenmesi Algoritmalarının Kullanılması.
  • Osowski, S., Siwek, K., & Markiewicz, T. (2004, June). Mlp and svm networks-a comparative study. In Proceedings of the 6th Nordic Signal Processing Symposium, 2004. NORSIG 2004. (pp. 37-40). IEEE.
  • Pang, B., Lee, L., & Vaithyanathan, S. (2002). Thumbs up? Sentiment classification using machine learning techniques. arXiv preprint cs/0205070.
  • Parlar, T., Saraç, E., & Özel, S. A. (2017, May). Comparison of feature selection methods for sentiment analysis on Turkish Twitter data. In 2017 25th Signal Processing and Communications Applications Conference (SIU) (pp. 1-4). IEEE.
  • Seker, S. E. (2016). Duygu Analizi (Sentimental Analysis). YBS Ansiklopedi, 3(3), 21-36.
  • Şentürk, A. (2006). Veri madenciliği: kavram ve teknikler. Ekin Yayınevi.
  • Taşçı, M. E., & Şamlı, R. (2020). Veri Madenciliği İle Kalp Hastalığı Teşhisi. Avrupa Bilim ve Teknoloji Dergisi, 88-95.
  • Topaçan, Ü. (2016). Sosyal medya paylaşımlarında duygu analizi: makine öğrenimi yaklaşımı üzerine bir araştırma. Doktora Tezi, Marmara Üniversitesi Sosyal Bilimler Enstitüsü, İstanbul, 1-216.
  • Uçkan, T., Cengiz, H. A. R. K., Seyyarer, E., & Karcı, A. Ağırlıklandırılmış Çizgelerde Tf-Idf ve Eigen Ayrışımı Kullanarak Metin Sınıflandırma. Bitlis Eren Üniversitesi Fen Bilimleri Dergisi, 8(4), 1349-1362.
  • Varol, A. B., & İşeri, İ. (2019). Lenf Kanserine İlişkin Patoloji Görüntülerinin Makine Öğrenimi Yöntemleri ile Sınıflandırılması. Avrupa Bilim ve Teknoloji Dergisi, 404-410.
  • Zhang, L., Hua, K., Wang, H., Qian, G., & Zhang, L. (2014). Sentiment analysis on reviews of mobile users. Procedia Computer Science, 34, 458-465.
  • Wu, J., Cai, Z., & Zhu, X. (2013, August). Self-adaptive probability estimation for naive bayes classification. In The 2013 International Joint Conference on Neural Networks (IJCNN) (pp. 1-8). IEEE.
Toplam 29 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Mühendislik
Bölüm Makaleler
Yazarlar

Esra Çelik 0000-0001-5333-6622

Deniz Dal 0000-0003-0120-4315

Tolga Aydin 0000-0002-8971-3255

Yayımlanma Tarihi 30 Kasım 2021
Yayımlandığı Sayı Yıl 2021

Kaynak Göster

APA Çelik, E., Dal, D., & Aydin, T. (2021). Duygu Analizi İçin Veri Madenciliği Sınıflandırma Algoritmalarının Karşılaştırılması. Avrupa Bilim Ve Teknoloji Dergisi(27), 880-889. https://doi.org/10.31590/ejosat.905259