İnternet kullanımının hızla yaygınlaşmasıyla birlikte insanlar fikirlerini, şikayetlerini, duygularını farklı platformlarda ifade etmeye başlamışlardır. Buna koşut olarak internette toplanan verilerin hacmi her geçen gün büyümektedir. Çeşitli web siteleri ve sosyal medya kullanımı sonucu ortaya çıkan büyük verinin analiz edilmesi için yeni teknikler geliştirilmiştir. Duygu analizi, bu veri yığınlarından anlamlı bilgilerin çıkarılmasına yardımcı olabilir. Duygu analizi sayesinde, işletmeler, tüketicilerin duygularını olumlu, olumsuz veya nötr olarak sınıflayarak tüketicilerin tepkilerini ölçebilmektedir. Bu çalışmanın amacı otellerle ilgili yorumların duygu analizinin gerçekleştirilmesinde en başarılı makine öğrenmesi algoritmasının belirlenmesidir. Çalışmada İstanbul’da hizmet veren 20 otele yönelik 708 yorum bir araya getirilmiştir. Otellere yönelik müşteri yorumlarının pozitif ve negatif olarak sınıflandırılması için denetimli makine öğrenmesi algoritmalarından lojistik regresyon, k-en yakın komşu, naive Bayes ve destek vektör makineleri yöntemleri kullanılarak algoritmaların performansları karşılaştırılmıştır. Araştırma sonuçlarına göre lojistik regresyon yöntemi en başarılı yöntem olarak belirlenmiştir. Lojistik regresyon yöntemini sırasıyla destek vektör makineleri, naive Bayes ve k- en yakın komşu algoritmaları izlemektedir. Bu çalışmanın sonuçları literatüre yaptığı katkının yanı sıra otel yöneticilerine veri yönetimi ve müşteri ilişkilerinin geliştirilmesi konularında yol gösterici olması açısından önemlidir.
Sentiment analysis can help extract meaningful information from these data piles from various websites and social media and measure consumers' reactions by classifying consumers' emotions as positive, negative or neutral. The success of sentiment analysis varies according to feature selection, vector space selection and machine learning method. For this reason, determining the most successful method in sentiment analysis is still controversial and important. A limited number of studies have been conducted comparing the success of various machine learning methods in sentiment analysis of hotel reviews in English. Considering this gap, the purpose of this research is to determine the most successful machine learning algorithm for sentiment analysis of hotel reviews. For this purpose, 708 reviews for 5-star hotels in Istanbul were collected manually. Obtained data were classified as positive and negative using logistic regression, k-nearest neighbor, naive Bayes and support vector machine methods. Analysis results show that the logistic regression method was the most successful classification algorithm, with an accuracy rate of 0.92. It is followed by support vector machine (0.90), naive Bayes method (0.77) and k-nearest neighbor algorithms (0.66).
Primary Language | English |
---|---|
Subjects | Service Marketing, Tourism (Other) |
Journal Section | Research Articles |
Authors | |
Publication Date | February 29, 2024 |
Submission Date | July 14, 2023 |
Acceptance Date | October 21, 2023 |
Published in Issue | Year 2024 Volume: 7 Issue: 1 |