Research Article
BibTex RIS Cite

Makinelerin Öğrenmesi Yöntemlerinin Duygu Okuma Yeteneği: E-Ticaret Yorumlarini Anlamak

Year 2024, Volume: 9 Issue: Issue: 2, 133 - 141
https://doi.org/10.53070/bbd.1437223

Abstract

Günümüzde, forumlar, bloglar ve sosyal medyanın geniş kesimler tarafından yoğun bir şekilde kullanılması nedeniyle bireyler, düşüncelerini, fikirlerini ve duygularını bu platformlar üzerinden paylaşmaya başlamıştır. Sosyal medya kullanımındaki artışla birlikte, araştırmacılar da duygu analizi alanında yaptıkları çalışmaları artırmışlardır. Veri hacmindeki hızlı artışla birlikte, bu verilerin etkili bir şekilde yönetilmesi ve içinden anlamlı bilgilerin çıkarılması gerekliliği ortaya çıkmıştır. Bu bağlamda, akıllı hesaplama yöntemlerinin bu verileri analiz etmesi son derece kritik bir öneme sahiptir. Duygu analizi, verilere uygulanan bir dizi süreçle, anlamlı bilgi elde etmek amacıyla gerçekleştirilen bir yöntemdir. Bu araştırma çerçevesinde, bir metin içinde bulunan düşünce içeren verinin sistemli bir şekilde incelenmesi ve metnin duygu kategorisi ile duygu polaritesinin belirlenmesi amaçlanmıştır. Belirli e-ticaret sitelerinde yer alan ürünler ile ilgili yapılan yorumların yer aldığı bir veri seti kullanılmıştır. Toplanan bu veri setinde CountVectorizer ve TF-IDF Vectorizer yöntemleri ile özellik çıkarımları gerçekleştirilmiş ve 2 farklı etiketlemeyi (Pozitif Cümle-Negatif Cümle) doğru bir şekilde yapması amaçlanmıştır. Bu eğitim sırasında Lojistik Regresyon, Naive Bayes, Random Forests ve XGBoost makine öğrenmesi yöntemleri kullanılarak karşılaştırmalı sonuçlar rapor edilmiştir. ve çıkan sonuçların başarım değerleri karşılaştırılmıştır.

References

  • [1] B. Liu, Sentiment analysis and opinion mining. Springer Nature, 2022.
  • [2] TUZCU S. Çevrimiçi Kullanıcı Yorumlarının Duygu Analizi ile Sınıflandırılması. Eskişehir Türk Dünyası Uygulama ve Araştırma Merkezi Bilişim Dergisi. 2020;1(2):1-5.
  • [3] A. H. Aliwy ve E. H. Abdul Ameer, “Comparative Study of Five Text Classification Algorithms with their Improvements”, International Journal of Applied Engineering Research, 2017.
  • [4] Sevindi, B. İbrahim. "Türkçe Metinlerde Denetimli ve Sözlük Tabanlı Duygu Analizi Yaklaşımlarının Karşılaştırılması," Yüksek Lisans Tezi, 2013.
  • [5] Sadhasivam, Jayakumar & Babu, Ramesh. (2019). Sentiment Analysis of Amazon Products Using Ensemble Machine Learning Algorithm. International Journal of Mathematical, Engineering and Management Sciences. 4. 508-520. 10.33889/IJMEMS.2019.4.2-041.
  • [6] H. Alshalabi, S. Tiun, N. Omar, M. Albared, “Experiments on the Use of Feature Selection and Machine Learning Methods in Automatic Malay Text Categorization”, Science Direct, Procedia Technology, Elsevier, 2013.
  • [7] Amasyali, M. F., & Yildirim, T. (2004, April). Automatic text categorization of news articles. In Proceedings of the IEEE 12th Signal Processing and Communications Applications Conference, 2004. (Pp. 224-226). IEEE.
  • [8] Tüfekci, P., Uzun, E., & Sevinç, B. (2012, April). Text classification of web based news articles by using Turkish grammatical features. In 2012 20th Signal Processing and Communications Applications Conference (SIU) (pp. 1-4). IEEE.
  • [9] C. Sahoo, M. Wankhade, and B. K. Singh, “Sentiment analysis using deep learning techniques: a comprehensive review,”Int. J. Multimed. Inf. Retr., vol. 12, no. 2, p. 41, Dec. 2023, doi: 10.1007/s13735-023-00308-2.
  • [10] S. Kutabish, A. M. Soares, and B. Casais, “The Influence of Online Ratings and Reviews in Consumer Buying Behavior: A Systematic Literature Review,” 2023, pp. 113–136. doi: 10.1007/978-3-031-42788-6_8.
  • [11] O. Ozturk and A. Ozcan, “Sentiment Analysis in Turkish Using Transformer-Based Deep Learning Models,” 2023, pp. 1–15. doi: 10.1007/978-3-031-31956-3_1.
  • [12] P. Nandwani and R. Verma, “A review on sentiment analysis and emotion detection from text,” Soc. Netw. Anal. Min., vol. 11, no. 1, p. 81, Dec. 2021, doi: 10.1007/s13278-021-00776-6.
  • [13] Erdinҫ, H. Y., & Güran, A. (2019, April). Semisupervised Turkish Text Categorization with Word2Vec, Doc2Vec and FastText Algorithms. In 2019 27th Signal Processing and Communications Applications Conference (SIU) (pp. 1-4). IEEE.
  • [14] Aizawa Akiko, (2003). “An information-theoretic perspective of tf–idf measures”. Information Processing and Management. 39 (1), 45–65. doi:10.1016/S0306–4573(02)00021–3
  • [15] D. G. Kleinbaum ve M. Klein, “Logistic Regression: A Self-Learning Text (Statistics for Biology and Health)”, Third Edition. New York: Springer 2010.
  • [16] H. Deng, Y. Sun, Y. Chang, J. Han, “Probabilistic Models for Classification” C.C. Aggarwal (Eds.), Data Classification Algorithms and Applications (pp. 67-70), CRC Press, New York, USA, 2015.
  • [17] Akdağlı, E. (2021). “Makine öğrenmesinde naive bayes yöntemi”. Medi̇um.
  • [18] G. Louppe, “Understanding Random Forest”, doktora tezi, University of Liege, 2015.
  • [19] Chen T, Guestrin C. Xgboost: A scalable tree boosting system. In Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining (pp. 785-794), 2016.
  • [20] Demolli H, Dokuz AS, Ecemis A, Gokcek M. Wind power forecasting based on daily wind speed data using machine learning algorithms. Energy Conversion and Management, 198, 111823, 2019.
  • [21] A. C. KELLE and H. YÜCE, “MQTT Trafiğinde DoS Saldırılarının Makine Öğrenmesi ile Sınıflandırılması ve Modelin SHAP ile Yorumlanması,” J. Mater. Mechatronics A, vol. 3, no. 1, pp. 50–62, Jun. 2022, doi: 10.55546/jmm.995091.
  • [22]willzjc, “Word Cloud Dataset.” 2024. [Online]. Available: https://gist.github.com/willzjc/3523f6ecc0a618efaecd4e2183b7efcd

METİN TABANLI VERİLER ÜZERİNDE MAKİNE ÖĞRENMESİ YÖNTEMLERİNE DAYALI DUYGU ANALİZİ

Year 2024, Volume: 9 Issue: Issue: 2, 133 - 141
https://doi.org/10.53070/bbd.1437223

Abstract

Günümüzde, forumlar, bloglar ve sosyal medyanın geniş kesimler tarafından yoğun bir şekilde kullanılması nedeniyle bireyler, düşüncelerini, fikirlerini ve duygularını bu platformlar üzerinden paylaşmaya başlamıştır. Sosyal medya kullanımındaki artışla birlikte, araştırmacılar da duygu analizi alanında yaptıkları çalışmaları artırmışlardır. Veri hacmindeki hızlı artışla birlikte, bu verilerin etkili bir şekilde yönetilmesi ve içinden anlamlı bilgilerin çıkarılması gerekliliği ortaya çıkmıştır. Bu bağlamda, akıllı hesaplama yöntemlerinin bu verileri analiz etmesi son derece kritik bir öneme sahiptir. Duygu analizi, verilere uygulanan bir dizi süreçle, anlamlı bilgi elde etmek amacıyla gerçekleştirilen bir yöntemdir. Bu araştırma çerçevesinde, bir metin içinde bulunan düşünce içeren verinin sistemli bir şekilde incelenmesi ve metnin duygu kategorisi ile duygu polaritesinin belirlenmesi amaçlanmıştır. Belirli e-ticaret sitelerinde yer alan ürünler ile ilgili yapılan yorumların yer aldığı bir veri seti kullanılmıştır. Toplanan bu veri setinde CountVectorizer ve TF-IDF Vectorizer yöntemleri ile özellik çıkarımları gerçekleştirilmiş ve 2 farklı etiketlemeyi (Pozitif Cümle-Negatif Cümle) doğru bir şekilde yapması amaçlanmıştır. Bu eğitim sırasında Lojistik Regresyon, Naive Bayes, Random Forests ve XGBoost makine öğrenmesi yöntemleri kullanılarak karşılaştırmalı sonuçlar rapor edilmiştir. ve çıkan sonuçların başarım değerleri karşılaştırılmıştır.

References

  • [1] B. Liu, Sentiment analysis and opinion mining. Springer Nature, 2022.
  • [2] TUZCU S. Çevrimiçi Kullanıcı Yorumlarının Duygu Analizi ile Sınıflandırılması. Eskişehir Türk Dünyası Uygulama ve Araştırma Merkezi Bilişim Dergisi. 2020;1(2):1-5.
  • [3] A. H. Aliwy ve E. H. Abdul Ameer, “Comparative Study of Five Text Classification Algorithms with their Improvements”, International Journal of Applied Engineering Research, 2017.
  • [4] Sevindi, B. İbrahim. "Türkçe Metinlerde Denetimli ve Sözlük Tabanlı Duygu Analizi Yaklaşımlarının Karşılaştırılması," Yüksek Lisans Tezi, 2013.
  • [5] Sadhasivam, Jayakumar & Babu, Ramesh. (2019). Sentiment Analysis of Amazon Products Using Ensemble Machine Learning Algorithm. International Journal of Mathematical, Engineering and Management Sciences. 4. 508-520. 10.33889/IJMEMS.2019.4.2-041.
  • [6] H. Alshalabi, S. Tiun, N. Omar, M. Albared, “Experiments on the Use of Feature Selection and Machine Learning Methods in Automatic Malay Text Categorization”, Science Direct, Procedia Technology, Elsevier, 2013.
  • [7] Amasyali, M. F., & Yildirim, T. (2004, April). Automatic text categorization of news articles. In Proceedings of the IEEE 12th Signal Processing and Communications Applications Conference, 2004. (Pp. 224-226). IEEE.
  • [8] Tüfekci, P., Uzun, E., & Sevinç, B. (2012, April). Text classification of web based news articles by using Turkish grammatical features. In 2012 20th Signal Processing and Communications Applications Conference (SIU) (pp. 1-4). IEEE.
  • [9] C. Sahoo, M. Wankhade, and B. K. Singh, “Sentiment analysis using deep learning techniques: a comprehensive review,”Int. J. Multimed. Inf. Retr., vol. 12, no. 2, p. 41, Dec. 2023, doi: 10.1007/s13735-023-00308-2.
  • [10] S. Kutabish, A. M. Soares, and B. Casais, “The Influence of Online Ratings and Reviews in Consumer Buying Behavior: A Systematic Literature Review,” 2023, pp. 113–136. doi: 10.1007/978-3-031-42788-6_8.
  • [11] O. Ozturk and A. Ozcan, “Sentiment Analysis in Turkish Using Transformer-Based Deep Learning Models,” 2023, pp. 1–15. doi: 10.1007/978-3-031-31956-3_1.
  • [12] P. Nandwani and R. Verma, “A review on sentiment analysis and emotion detection from text,” Soc. Netw. Anal. Min., vol. 11, no. 1, p. 81, Dec. 2021, doi: 10.1007/s13278-021-00776-6.
  • [13] Erdinҫ, H. Y., & Güran, A. (2019, April). Semisupervised Turkish Text Categorization with Word2Vec, Doc2Vec and FastText Algorithms. In 2019 27th Signal Processing and Communications Applications Conference (SIU) (pp. 1-4). IEEE.
  • [14] Aizawa Akiko, (2003). “An information-theoretic perspective of tf–idf measures”. Information Processing and Management. 39 (1), 45–65. doi:10.1016/S0306–4573(02)00021–3
  • [15] D. G. Kleinbaum ve M. Klein, “Logistic Regression: A Self-Learning Text (Statistics for Biology and Health)”, Third Edition. New York: Springer 2010.
  • [16] H. Deng, Y. Sun, Y. Chang, J. Han, “Probabilistic Models for Classification” C.C. Aggarwal (Eds.), Data Classification Algorithms and Applications (pp. 67-70), CRC Press, New York, USA, 2015.
  • [17] Akdağlı, E. (2021). “Makine öğrenmesinde naive bayes yöntemi”. Medi̇um.
  • [18] G. Louppe, “Understanding Random Forest”, doktora tezi, University of Liege, 2015.
  • [19] Chen T, Guestrin C. Xgboost: A scalable tree boosting system. In Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining (pp. 785-794), 2016.
  • [20] Demolli H, Dokuz AS, Ecemis A, Gokcek M. Wind power forecasting based on daily wind speed data using machine learning algorithms. Energy Conversion and Management, 198, 111823, 2019.
  • [21] A. C. KELLE and H. YÜCE, “MQTT Trafiğinde DoS Saldırılarının Makine Öğrenmesi ile Sınıflandırılması ve Modelin SHAP ile Yorumlanması,” J. Mater. Mechatronics A, vol. 3, no. 1, pp. 50–62, Jun. 2022, doi: 10.55546/jmm.995091.
  • [22]willzjc, “Word Cloud Dataset.” 2024. [Online]. Available: https://gist.github.com/willzjc/3523f6ecc0a618efaecd4e2183b7efcd
There are 22 citations in total.

Details

Primary Language Turkish
Subjects Machine Learning (Other), Natural Language Processing
Journal Section PAPERS
Authors

Mert Halil Durak 0009-0005-7274-8098

Cengiz Hark 0000-0002-5190-3504

Early Pub Date December 24, 2024
Publication Date
Submission Date May 7, 2024
Acceptance Date July 10, 2024
Published in Issue Year 2024 Volume: 9 Issue: Issue: 2

Cite

APA Durak, M. H., & Hark, C. (2024). Makinelerin Öğrenmesi Yöntemlerinin Duygu Okuma Yeteneği: E-Ticaret Yorumlarini Anlamak. Computer Science, 9(Issue: 2), 133-141. https://doi.org/10.53070/bbd.1437223

The Creative Commons Attribution 4.0 International License 88x31.png is applied to all research papers published by JCS and

A Digital Object Identifier (DOI) Logo_TM.png is assigned for each published paper