This study aims to predict user rating scores by analyzing video game user reviews with data analysis and machine learning models. The dataset includes both quantitative and qualitative variables such as user ratings, review texts, price information, playing time, game type and platform. Regression-based prediction models were developed using machine learning models such as Linear Regression, Random Forest, Gradient Boosting and Extra Trees. The performance of the models was evaluated with the metrics of Mean Absolute Error (MAE), Mean Square Error (MSE), Root Mean Square Error (RMSE) and Coefficient of Determination (R²). The results of the analysis show that all models provide a high level of accuracy, with the Linear Regression model being the most successful model with the lowest error values. It is understood that even simple models can exhibit superior performance in datasets where linear relationships predominate and that data structure plays a decisive role in model selection. The findings reveal that text mining and machine learning based approaches are effective in predicting user satisfaction in the context of the gaming industry. In this context, the study contributes to the development of decision support systems based on data-driven analysis of consumer behavior and machine learning in the video game industry.
Yapılan çalışma, video oyunları kullanıcı yorumlarını veri analizi ve makine öğrenmesi modelleri ile inceleyerek kullanıcı değerlendirme puanlarının tahmin edilmesini amaçlamaktadır. Veri seti; kullanıcı puanları, yorum metinleri, fiyat bilgileri, oyun süresi, oyun türü ve platform gibi hem nicel hem de nitel değişkenleri birlikte içermektedir. Makine öğrenmesi modellerinden Doğrusal Regresyon, Rastgele Orman, Gradyan Artırma ve Ekstra Ağaçlar kullanılarak regresyon tabanlı tahmin modelleri geliştirilmiştir. Modellerin başarımı Ortalama Mutlak Hata (MAE), Ortalama Kare Hata (MSE), Kök Ortalama Kare Hata (RMSE) ve Belirlilik Katsayısı (R²) metrikleri ile değerlendirilmiştir. Elde edilen analiz bulguları, tüm modellerin yüksek düzeyde doğruluk sağladığını göstermekle beraber, Doğrusal Regresyon modeli en düşük hata değerleri ile en başarılı model olmuştur. Doğrusal ilişkilerin baskın olduğu veri setlerinde basit modellerin dahi üstün performans sergileyebileceği ve model seçiminde veri yapısının belirleyici rol oynadığı anlaşılmıştır. Bulgular, metin madenciliği ve makine öğrenmesi tabanlı yaklaşımların oyun sektörü bağlamında kullanıcı memnuniyetini tahmin etmede etkili olduğunu ortaya koymaktadır. Bu bağlamda çalışma, video oyun sektöründe tüketici davranışlarının veri odaklı analizi ve makine öğrenmesine dayalı karar destek sistemlerinin geliştirilmesine katkılar sağlamaktadır.
Teknik analizler, veri ön işleme süreçleri ve Python dili ile programlama sürecinde sağladıkları rehberlik ve geri bildirimler için C ve Sistem Programcıları Derneği çalışanlarına (https://csystem.org/) ve Dernek Başkanı Dr. Kaan ASLAN’a teşekkür ederim. Dr. Kaan ASLAN, özellikle veri temizleme, model hiperparametre optimizasyonu ve performans değerlendirme süreçlerine katkı sağlamış olup, çalışmanın doğruluk oranlarının artırılması konusunda öneriler sunmuştur.
Primary Language | Turkish |
---|---|
Subjects | Policy and Administration (Other) |
Journal Section | Research Articles |
Authors | |
Publication Date | June 30, 2025 |
Submission Date | April 9, 2025 |
Acceptance Date | April 27, 2025 |
Published in Issue | Year 2025 Volume: 5 Issue: 1 |