TY - JOUR T1 - Veri Bilimi ile Otel Rezervasyon İptallerinin Tahmini: SHAP Tabanlı Açıklanabilirlik ve Performans Analizi TT - Predicting Hotel Reservation Cancellations with Data Science: SHAP-Based Explainability and Performance Analysis AU - Eşidir, Kamil Abdullah PY - 2025 DA - October Y2 - 2025 DO - 10.33712/mana.1737947 JF - Uluslararası Yönetim Akademisi Dergisi JO - Yönetim Akademisi PB - Mehmet MECEK WT - DergiPark SN - 2636-8048 SP - 767 EP - 785 VL - 8 IS - 3 LA - tr AB - Turizm sektöründe gelir yönetimi ve operasyonel planlamanın etkinliği, rezervasyon iptallerinin doğru şekilde tahmin edilmesine bağlıdır. Bu çalışmada, otel rezervasyon iptallerinin makine öğrenmesi temelli modeller aracılığıyla öngörülmesi amaçlanmıştır. Veri kaynağı olarak, 2015–2017 dönemine ait 119.390 gözlemden oluşan açık erişimli “Hotel Booking Demand” veri kümesi kullanılmıştır. Sınıf dengesizliği problemi SMOTE yöntemiyle giderilmiş; Random Forest, XGBoost, LightGBM ve CatBoost modelleri ile tahminlemeler gerçekleştirilmiştir. Modeller; doğruluk, AUC, F1 skoru ve özellikle eğitim süresi gibi performans metrikleriyle karşılaştırılmıştır. En yüksek doğruluk oranı (%81) ve AUC skoru (0,89) Random Forest modeliyle elde edilmiştir. Modelin karar süreçleri SHAP analiziyle açıklanmış; özellikle “lead_time”, “adr” ve “hotel” değişkenlerinin belirleyici olduğu tespit edilmiştir. Bulgular, rezervasyon iptallerinin önceden tahmin edilmesinin, turizm sektöründe karar destek sistemlerine entegre edilebilecek anlamlı öngörüler sunduğunu göstermektedir. KW - Otel Rezervasyon İptali KW - Makine Öğrenimi KW - SMOTE KW - SHAP Analizi N2 - The effectiveness of revenue management and operational planning in the tourism sector largely depends on the ability to accurately predict reservation cancellations. This study aims to predict hotel reservation cancellations using machine learning-based models. An open-access dataset entitled “Hotel Booking Demand”, consisting of 119,390 observations from 2015 to 2017, is employed as the primary data source. To address the class imbalance problem, the SMOTE technique is applied. Prediction tasks are carried out using four models: Random Forest, XGBoost, LightGBM, and CatBoost. These models are compared based on multiple evaluation metrics including accuracy, AUC, F1-score, and training time. The Random Forest model achieves the highest performance with an accuracy of 81% and an AUC score of 0.89. The model’s decision-making processes are interpreted using SHAP analysis, which reveals that variables such as “lead_time”, “adr”, and “hotel” are particularly influential. The findings indicate that early prediction of reservation cancellations can provide valuable insights for the integration of data-driven decision support systems in the tourism industry. CR - ANTONIO, Nuno, ALMEIDA, Ana de ve NUNES, Luis (2017), “Predicting Hotel Bookings Cancellation with a Machine Learning Classification Model”, 16th IEEE International Conference on Machine Learning and Applications (ICMLA), 18-21 December 2017 – Cansun, IEEE Publisher, New York, ss.1049-1054. CR - ANTONIO, Nuno, ALMEIDA, Ana de ve NUNES, Luis (2019), “Hotel Booking Demand Datasets”, Data in Brief, S.22, ss.41-49. CR - ASLAN, Kaan (2025), Yapay Zekâ, Makine Öğrenmesi ve Veri Bilimi Kursu, Sınıfta Yapılan Örnekler ve Özet Notlar, C ve Sistem Programcıları Derneği Yayını, İstanbul. CR - BOZ, Mehmet, CANBAZOĞLU, Erokan, ÖZEN, Zeki ve GÜLSEÇEN, Sevinç (2018), “Otel Rezervasyon İptallerinin Makine Öğrenmesi Yöntemleri ile Tahmin Edilmesi”, Veri Bilimi, S.1(1), ss.7-14. CR - CAGGIA, Caitlyn (2021), “Forecasting Hotel Reservation Cancellations with Machine Learning”, Lodging Magazine (E-Article), 10 March 2021, https://www.lodgingmagazine.com/forecasting-hotel-reservation-cancellations-with-machine-learning/ (Erişim Tarihi: 14.07.2025). CR - CHATFIELD, Christopher (1995), Problem Solving: A Statistician’s Guide, Chapman & Hall Publisher, Londra, 2nd Edition. CR - CHEN, Tianqi ve GUESTRIN, Carlos (2016), “XGBoost: A scalable Tree Boosting System”, Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 13-17 August 2016 – San Francisco, Association for Computing Machinery Publisher, New York, ss.785-794. CR - ERCAN, Uğur ve IRMAK, Sezgin (2022), “Turizm Endüstrisinde Otel Rezervasyon İptallerinin Makine Öğrenmesi Yöntemleri ile Tahmini”, Journal of Gastronomy, Hospitality and Travel, S.5(1), ss.45-54. CR - EŞİDİR, Kamil Abdullah (2025a), “Makine Öğrenimi Modelleri İle Yetişkin Eğitimi Analizi: Modellerin Karşılaştırmalı Performansı”, Elektronik Sosyal Bilimler Dergisi, S.24(2), ss.946-964. CR - EŞİDİR, Kamil Abdullah (2025b), “Video Oyunları Kullanıcı Yorumlarının Makine Öğrenmesi İle Tahmini: Veri Bilimi Perspektifinden Bir İnceleme”, MTÜ Sosyal ve Beşeri Bilimler Dergisi, S.5(1), ss.97-108. CR - FERNHOLZ, Luisa T. ve MORGENTHALER, Stephan (2000), “A Conversation with John W. Tukey and Elizabeth Tukey”, Statistical Science, S.15(1), ss.79-94. CR - JISHAN, Md Asifuzzaman., SINGH, Vikas, GHOSH, Ayan Kumar, ALAM, Md Shahabub, MAHMUD, Khan Raqib ve PAUL, Bijan (2024), “Hotel Booking Cancellation Prediction Using Applied Bayesian Models”, arXiv Preprint (E-Article), 21 October 2024, https://arxiv.org/abs/2410.16406 (Erişim Tarihi: 14.07.2025). CR - KARACA, Şükran ve AKIN, Mehmet Halit (2025), “Turizmde Makine Öğrenmesi ile İlgili Ulusal Yazındaki Çalışmaların Bibliyometrik Analizi”, TURAR Turizm ve Araştırma Dergisi, S.14(1), ss.169-195. CR - KE, Guolin, MENG, Qi, FINLEY, Thomas, WANG, Taifeng, CHEN, Wei, MA, Weidong, YE, Qiwei ve LIU, Tie-Yan (2017), “Light GBM: A Highly Efficient Gradient Boosting Decision Tree”, Advances in Neural Information Processing Systems, S.30, ss.3146-3154. CR - MOSTIPAK, Jesse (2018), “Hotel Booking Demand”, Kaggle (E-Article), https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand (Erişim Tarihi: 14.07.2025). CR - OGUINE, Ozioma Collins ve OGUINE, Kanyifeechukwu Jane, OKORIE, Chukwudindu I. ve OGUINE, Munachimso Blessing (2021), “Comparative Analysis and Forecasting on the Death Rate of COVID-19 Patients in Nigeria Using Random Forest and Multinomial Bayesian Epidemiological Models”, Journal of Clinical Case Studies, Reviews & Reports, S.3(4), ss.1-7. CR - PROKHORENKOVA, Liudmila, GUSEV, Gleb, VOROBEV, Aleksandr, DOROGUSH, Anna Veronika ve GULIN, Andrey (2018), “CatBoost: Unbiased Boosting with Categorical Features”, Advances in Neural Information Processing Systems, S.31, ss.6639-6649. CR - ŞAHİNBAŞ, Kevser ve DOĞUÇ, Özge (2022), “Otel Rezervasyon İptal Tahmin Modelinin Veri Madenciliği Algoritmaları ile Uygulanması”, Selçuk Turizm ve Bilişim Araştırmaları Dergisi, S.1(2), ss.15-24. CR - WANG, Liyang., WANG, Xiaoya, CHEN, Angxuan, JIN, Xian ve CHE, Huilian (2020), “Prediction of Type 2 Diabetes Risk and its Effect Evaluation Based on the Xgboost Mode”, Healthcare, S.8(3), ss.(247). UR - https://doi.org/10.33712/mana.1737947 L1 - https://dergipark.org.tr/en/download/article-file/5036451 ER -