With the development of technology, the e-commerce sector has grown very rapidly. Thanks to this development, a large increase is observed in the comments made on the products. As the number of reviews of the products increased, it became very difficult to examine and analyze them one by one, and the sellers became unable to evaluate all the comments made on their products. Within the scope of this study, a sentiment analysis study was conducted on e-commerce product reviews. First, 15170 product reviews were collected from e-commerce platforms operating in Turkey. In the labeling phase of the raw data set, the comments were labeled twice as positive and negative at different times and a two-class data set was prepared. With this dataset, a model was trained using the Long-Short-Term Memory algorithm, and a data set containing 203274 comments collected from e-commerce platforms was automatically labeled with this model. In the second stage of the study, the performance of the automatically labeled dataset was compared with the manually labeled dataset using four different deep learning algorithms (Recurrent Neural Networks, Long-Short-Term Memory, Gated Recurrent Unit, Convolutional Neural Networks). In the last stage of the study, classification performances of four traditional machine learning (Logistic Regression, Support Vector Machines, Random Forest, Naive Bayes) and four different deep learning algorithms were compared using automatically labeled datasets with high classification performance. As a result of the experimental studies, it has been observed that deep learning algorithms are more successful than machine learning algorithms, and high results have been obtained in experiments where the data set automatically labeled with the developed model is used.
Machine Learning Deep Learning Text Mining Turkish Texts E-commerce Product Reviews
Teknolojinin gelişmesiyle birlikte e-ticaret sektörü oldukça hızlı bir büyüme sağlamıştır. Bu gelişim sayesinde ürünlere yapılan yorumlarda büyük oranlarda artış gözlemlenmektedir. Ürünlerin yorum sayıları arttıkça bunları tek tek inceleyip analiz etmek oldukça zorlaşmış ve satıcılar ürünlerine yapılan yorumların hepsini değerlendiremez duruma gelmiştir. Bu çalışma kapsamında, e-ticaret ürün yorumları üzerinden bir duygu analizi çalışması gerçekleştirilmiştir. Öncelikle Türkiye’de faaliyet gösteren e-ticaret platformlarından 15170 adet ürün yorumu toplanmıştır. Ham veri setinin etiketleme aşamasında yorumlar olumlu ve olumsuz olarak farklı zamanlarda iki kere etiketlenmiş ve iki sınıflı bir veri seti hazırlanmıştır. Bu veri seti ile Uzun-Kısa Süreli Bellek algoritması kullanılarak bir model eğitilmiş ve bu modelle yine e-ticaret platformlarından toplanan 203274 adet yorumun yer aldığı bir veri seti otomatik olarak etiketlenmiştir. Çalışmanın ikinci aşamasında, otomatik olarak etiketlenmiş veri setinin performansı dört farklı derin öğrenme algoritması (Tekrarlayan Sinir Ağları, Uzun-Kısa Süreli Bellek, Geçitli Tekrarlayan Birim, Evrişimli Sinir Ağları) kullanılarak manuel olarak etiketlenmiş veri setiyle karşılaştırılmıştır. Çalışmanın son aşamasında, yüksek sınıflandırma performansı gösteren otomatik olarak etiketlenmiş veri seti kullanılarak dört geleneksel makine öğrenmesi (Lojistik Regresyon, Destek Vektör Makineleri, Rastgele Orman, Naive Bayes) ile dört farklı derin öğrenme algoritmasının sınıflandırma performansları karşılaştırılmıştır. Yapılan deneysel çalışmalar sonucunda, derin öğrenme algoritmalarının makine öğrenmesi algoritmalarına kıyasla daha başarılı olduğu gözlemlenmiş ve geliştirilen modelle otomatik olarak etiketlenen veri setinin kullanıldığı deneylerde yüksek sonuçlar elde edilmiştir.
Makine Öğrenmesi Derin Öğrenme Metin Madenciliği Türkçe Metinler E-ticaret Ürün Yorumları
Birincil Dil | Türkçe |
---|---|
Konular | Derin Öğrenme |
Bölüm | Makaleler |
Yazarlar | |
Erken Görünüm Tarihi | 5 Aralık 2023 |
Yayımlanma Tarihi | 15 Aralık 2023 |
Yayımlandığı Sayı | Yıl 2023 Sayı: 52 |