Research Article
BibTex RIS Cite

Prediction of Video Game User Reviews With Machine Learning: A Review From a Data Science Perspective

Year 2025, Volume: 5 Issue: 1, 97 - 108, 30.06.2025

Abstract

This study aims to predict user rating scores by analyzing video game user reviews with data analysis and machine learning models. The dataset includes both quantitative and qualitative variables such as user ratings, review texts, price information, playing time, game type and platform. Regression-based prediction models were developed using machine learning models such as Linear Regression, Random Forest, Gradient Boosting and Extra Trees. The performance of the models was evaluated with the metrics of Mean Absolute Error (MAE), Mean Square Error (MSE), Root Mean Square Error (RMSE) and Coefficient of Determination (R²). The results of the analysis show that all models provide a high level of accuracy, with the Linear Regression model being the most successful model with the lowest error values. It is understood that even simple models can exhibit superior performance in datasets where linear relationships predominate and that data structure plays a decisive role in model selection. The findings reveal that text mining and machine learning based approaches are effective in predicting user satisfaction in the context of the gaming industry. In this context, the study contributes to the development of decision support systems based on data-driven analysis of consumer behavior and machine learning in the video game industry.

References

  • Altuntaş, B., & Karaarslan, M. H. (2017), “Kullanıcıların Mobil Oyun Tercihinde Etkili Olan Faktör Düzeylerinin Öneminin Belirlenmesi”, Uluslararası İktisadi ve İdari İncelemeler Dergisi(19), 277-298. https://doi.org/10.18092/ulikidince.321570
  • Aslan, K. (2025), “Yapay Zekâ, Makine Öğrenmesi ve Veri Bilimi Kursu”, Sınıfta Yapılan Örnekler ve Özet Notlar, C ve Sistem Programcıları Derneği, İstanbul.
  • Aydın, O. & Sarıca, Y., (2024), “Dijital Oyun Geri Bildirimlerinin Duygu Analizi ile İncelenmesi: E-WoM’dan r-WoM’a Geçiş Mümkün mü?”, Üçüncü Sektör Sosyal Ekonomi Dergisi, 59(4), 2667-2683. https://doi.org/10.15659/3.sektor-sosyal-ekonomi.24.11.2559
  • Bonsignori, V., Guidotti, R., Monreale, A. (2021), “Deriving a Single Interpretable Model by Merging TreeBased Classifiers”, Discovery Science: 24th International Conference, 11-13 Ekim, Halifax, Kanada, 347-357. http://dx.doi.org/10.1007/978-3-030-88942-5_27
  • Chai, T., & Draxler, R. R. (2014), “Root mean square error (RMSE) or mean absolute error (MAE)?–Arguments Against Avoiding RMSE In The Literature”, Geoscientific Model Development, 7(3), 1247–1250. https://doi.org/10.5194/gmd-7-1247-2014
  • Çabuk, M., Yücalar, F., & Toçoğlu, M. A. (2023), “Makine Öğrenmesi ile E-Ticaret Ürün Yorumlarının Otomatik Analizi”, Avrupa Bilim ve Teknoloji Dergisi(52), 110-121. DOI:10.5281/zenodo.10259157
  • Gür, Y. E. (2024), “Stock Price Forecasting Using Machine Learning and Deep Learning Algorithms: A Case Study For The Aviation Industry”, Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 36(1), 25-34. https://doi.org/10.35234/fumbd.1357613
  • Ji H. (2023), “Robustness Analysis On Stock Market Prediction Method”, Highlights in Business, Economics and Management, (2957-952X), 21:791-801. DOI: 10.54097/hbem.v21i.14763
  • Mustafaoğlu, R. (2018), “E-Spor”, Spor ve Fiziksel Aktivite. Ulusal Spor Bilimleri Dergisi, 2(2), 84-96. https://doi.org/10.30769/usbd.457545
  • Oguine OC ve Oguine MB. (2021), “Comparative Analysis and Forecasting On The Death Rate Of Covid-19 Patients In Nigeria Using Random Forest and Multinomial Bayesian Epidemiological Models”, Journal of Clinical Case Studies Reviews & Reports, 1-7. DOI: 10.47363/JCCSR/2021(3)182
  • Olmedilla, M., Espinosa-Leal, L., Romero-Moreno, J.C., & Li, Z. (2024), “Predicting Review Helpfulness in Video Games: A Comparative Analysis of Machine Learning Models and NLP Integration”, IADIS International Journal on WWW/Internet, ISSN: 1645-7641, 22(2), 1–15.
  • Özdemir, A. (2023), “Makine Öğrenmesi Algoritmaları ile Aritmilerin Sınıflandırılması”, Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi, 39(3), 394-402.
  • Paliwal, J. (2021), “Video Game Reviews and Ratings [Data set]”, Kaggle. https://www.kaggle.com/datasets/ jahnavipaliwal/video-game-reviews-and-ratings
  • Probst, P., Wright, M. N., & Boulesteix, A. L. (2019), “Hyperparameters and Tuning Strategies For Random Forest”, Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 9(3), e1301. https://doi.org/10.1002/widm. 1301
  • Speer AB. (2021), “Empirical Attrition Modelling and Discrimination: Balancing Validity and Group Differences”, Human Resource Management Journal, 34 (1), 1-19. https://doi.org/10.1111/1748-8583.12355
  • Turp Gölbaşı, B., & Ayhan Gökcek, H. (2022), “Dijital Pazarlamaya Yönelik Olarak Oyunlaştırma İçeren E-Ticaret Siteleri Üzerine Bir Meta Analiz”, Elektronik Sosyal Bilimler Dergisi, 21(84), 1909-1929. https://doi.org/10.17755/esosder.1064214
  • Tuzcu S. (2020), “Çevrimiçi Kullanıcı Yorumlarının Duygu Analizi ile Sınıflandırılması”, ESTUDAM Bilişim, c. 1, sy. 2, 1–5.
  • Wu Y. (2023), “Job Embeddedness Review: Presentation, Measurement and Development. Advances in Economics, Management and Political Sciences, 47 (1), 169- 174. https://doi.org/10.54254/2754-1169/47/20230393
  • Zhu X, Sawhney R, Upreti G. (2016), “Determinates Of Employee Voluntary Turnover and Forecasting In Departments: A Case Study”, Studies in Engineering and Technology, 3(1):64-73. https://doi.org/10.11114/set.v3i1.1635

Video Oyunları Kullanıcı Yorumlarının Makine Öğrenmesi İle Tahmini: Veri Bilimi Perspektifinden Bir İnceleme

Year 2025, Volume: 5 Issue: 1, 97 - 108, 30.06.2025

Abstract

Yapılan çalışma, video oyunları kullanıcı yorumlarını veri analizi ve makine öğrenmesi modelleri ile inceleyerek kullanıcı değerlendirme puanlarının tahmin edilmesini amaçlamaktadır. Veri seti; kullanıcı puanları, yorum metinleri, fiyat bilgileri, oyun süresi, oyun türü ve platform gibi hem nicel hem de nitel değişkenleri birlikte içermektedir. Makine öğrenmesi modellerinden Doğrusal Regresyon, Rastgele Orman, Gradyan Artırma ve Ekstra Ağaçlar kullanılarak regresyon tabanlı tahmin modelleri geliştirilmiştir. Modellerin başarımı Ortalama Mutlak Hata (MAE), Ortalama Kare Hata (MSE), Kök Ortalama Kare Hata (RMSE) ve Belirlilik Katsayısı (R²) metrikleri ile değerlendirilmiştir. Elde edilen analiz bulguları, tüm modellerin yüksek düzeyde doğruluk sağladığını göstermekle beraber, Doğrusal Regresyon modeli en düşük hata değerleri ile en başarılı model olmuştur. Doğrusal ilişkilerin baskın olduğu veri setlerinde basit modellerin dahi üstün performans sergileyebileceği ve model seçiminde veri yapısının belirleyici rol oynadığı anlaşılmıştır. Bulgular, metin madenciliği ve makine öğrenmesi tabanlı yaklaşımların oyun sektörü bağlamında kullanıcı memnuniyetini tahmin etmede etkili olduğunu ortaya koymaktadır. Bu bağlamda çalışma, video oyun sektöründe tüketici davranışlarının veri odaklı analizi ve makine öğrenmesine dayalı karar destek sistemlerinin geliştirilmesine katkılar sağlamaktadır.

Thanks

Teknik analizler, veri ön işleme süreçleri ve Python dili ile programlama sürecinde sağladıkları rehberlik ve geri bildirimler için C ve Sistem Programcıları Derneği çalışanlarına (https://csystem.org/) ve Dernek Başkanı Dr. Kaan ASLAN’a teşekkür ederim. Dr. Kaan ASLAN, özellikle veri temizleme, model hiperparametre optimizasyonu ve performans değerlendirme süreçlerine katkı sağlamış olup, çalışmanın doğruluk oranlarının artırılması konusunda öneriler sunmuştur.

References

  • Altuntaş, B., & Karaarslan, M. H. (2017), “Kullanıcıların Mobil Oyun Tercihinde Etkili Olan Faktör Düzeylerinin Öneminin Belirlenmesi”, Uluslararası İktisadi ve İdari İncelemeler Dergisi(19), 277-298. https://doi.org/10.18092/ulikidince.321570
  • Aslan, K. (2025), “Yapay Zekâ, Makine Öğrenmesi ve Veri Bilimi Kursu”, Sınıfta Yapılan Örnekler ve Özet Notlar, C ve Sistem Programcıları Derneği, İstanbul.
  • Aydın, O. & Sarıca, Y., (2024), “Dijital Oyun Geri Bildirimlerinin Duygu Analizi ile İncelenmesi: E-WoM’dan r-WoM’a Geçiş Mümkün mü?”, Üçüncü Sektör Sosyal Ekonomi Dergisi, 59(4), 2667-2683. https://doi.org/10.15659/3.sektor-sosyal-ekonomi.24.11.2559
  • Bonsignori, V., Guidotti, R., Monreale, A. (2021), “Deriving a Single Interpretable Model by Merging TreeBased Classifiers”, Discovery Science: 24th International Conference, 11-13 Ekim, Halifax, Kanada, 347-357. http://dx.doi.org/10.1007/978-3-030-88942-5_27
  • Chai, T., & Draxler, R. R. (2014), “Root mean square error (RMSE) or mean absolute error (MAE)?–Arguments Against Avoiding RMSE In The Literature”, Geoscientific Model Development, 7(3), 1247–1250. https://doi.org/10.5194/gmd-7-1247-2014
  • Çabuk, M., Yücalar, F., & Toçoğlu, M. A. (2023), “Makine Öğrenmesi ile E-Ticaret Ürün Yorumlarının Otomatik Analizi”, Avrupa Bilim ve Teknoloji Dergisi(52), 110-121. DOI:10.5281/zenodo.10259157
  • Gür, Y. E. (2024), “Stock Price Forecasting Using Machine Learning and Deep Learning Algorithms: A Case Study For The Aviation Industry”, Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 36(1), 25-34. https://doi.org/10.35234/fumbd.1357613
  • Ji H. (2023), “Robustness Analysis On Stock Market Prediction Method”, Highlights in Business, Economics and Management, (2957-952X), 21:791-801. DOI: 10.54097/hbem.v21i.14763
  • Mustafaoğlu, R. (2018), “E-Spor”, Spor ve Fiziksel Aktivite. Ulusal Spor Bilimleri Dergisi, 2(2), 84-96. https://doi.org/10.30769/usbd.457545
  • Oguine OC ve Oguine MB. (2021), “Comparative Analysis and Forecasting On The Death Rate Of Covid-19 Patients In Nigeria Using Random Forest and Multinomial Bayesian Epidemiological Models”, Journal of Clinical Case Studies Reviews & Reports, 1-7. DOI: 10.47363/JCCSR/2021(3)182
  • Olmedilla, M., Espinosa-Leal, L., Romero-Moreno, J.C., & Li, Z. (2024), “Predicting Review Helpfulness in Video Games: A Comparative Analysis of Machine Learning Models and NLP Integration”, IADIS International Journal on WWW/Internet, ISSN: 1645-7641, 22(2), 1–15.
  • Özdemir, A. (2023), “Makine Öğrenmesi Algoritmaları ile Aritmilerin Sınıflandırılması”, Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi, 39(3), 394-402.
  • Paliwal, J. (2021), “Video Game Reviews and Ratings [Data set]”, Kaggle. https://www.kaggle.com/datasets/ jahnavipaliwal/video-game-reviews-and-ratings
  • Probst, P., Wright, M. N., & Boulesteix, A. L. (2019), “Hyperparameters and Tuning Strategies For Random Forest”, Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 9(3), e1301. https://doi.org/10.1002/widm. 1301
  • Speer AB. (2021), “Empirical Attrition Modelling and Discrimination: Balancing Validity and Group Differences”, Human Resource Management Journal, 34 (1), 1-19. https://doi.org/10.1111/1748-8583.12355
  • Turp Gölbaşı, B., & Ayhan Gökcek, H. (2022), “Dijital Pazarlamaya Yönelik Olarak Oyunlaştırma İçeren E-Ticaret Siteleri Üzerine Bir Meta Analiz”, Elektronik Sosyal Bilimler Dergisi, 21(84), 1909-1929. https://doi.org/10.17755/esosder.1064214
  • Tuzcu S. (2020), “Çevrimiçi Kullanıcı Yorumlarının Duygu Analizi ile Sınıflandırılması”, ESTUDAM Bilişim, c. 1, sy. 2, 1–5.
  • Wu Y. (2023), “Job Embeddedness Review: Presentation, Measurement and Development. Advances in Economics, Management and Political Sciences, 47 (1), 169- 174. https://doi.org/10.54254/2754-1169/47/20230393
  • Zhu X, Sawhney R, Upreti G. (2016), “Determinates Of Employee Voluntary Turnover and Forecasting In Departments: A Case Study”, Studies in Engineering and Technology, 3(1):64-73. https://doi.org/10.11114/set.v3i1.1635
There are 19 citations in total.

Details

Primary Language Turkish
Subjects Policy and Administration (Other)
Journal Section Research Articles
Authors

Kamil Abdullah Eşidir 0000-0002-8106-1758

Publication Date June 30, 2025
Submission Date April 9, 2025
Acceptance Date April 27, 2025
Published in Issue Year 2025 Volume: 5 Issue: 1

Cite

APA Eşidir, K. A. (2025). Video Oyunları Kullanıcı Yorumlarının Makine Öğrenmesi İle Tahmini: Veri Bilimi Perspektifinden Bir İnceleme. MTÜ Sosyal Ve Beşeri Bilimler Dergisi, 5(1), 97-108.