Research Article
BibTex RIS Cite

Veri Bilimi ile Otel Rezervasyon İptallerinin Tahmini: SHAP Tabanlı Açıklanabilirlik ve Performans Analizi

Year 2025, Volume: 8 Issue: 3, 767 - 785, 15.10.2025
https://doi.org/10.33712/mana.1737947

Abstract

Turizm sektöründe gelir yönetimi ve operasyonel planlamanın etkinliği, rezervasyon iptallerinin doğru şekilde tahmin edilmesine bağlıdır. Bu çalışmada, otel rezervasyon iptallerinin makine öğrenmesi temelli modeller aracılığıyla öngörülmesi amaçlanmıştır. Veri kaynağı olarak, 2015–2017 dönemine ait 119.390 gözlemden oluşan açık erişimli “Hotel Booking Demand” veri kümesi kullanılmıştır. Sınıf dengesizliği problemi SMOTE yöntemiyle giderilmiş; Random Forest, XGBoost, LightGBM ve CatBoost modelleri ile tahminlemeler gerçekleştirilmiştir. Modeller; doğruluk, AUC, F1 skoru ve özellikle eğitim süresi gibi performans metrikleriyle karşılaştırılmıştır. En yüksek doğruluk oranı (%81) ve AUC skoru (0,89) Random Forest modeliyle elde edilmiştir. Modelin karar süreçleri SHAP analiziyle açıklanmış; özellikle “lead_time”, “adr” ve “hotel” değişkenlerinin belirleyici olduğu tespit edilmiştir. Bulgular, rezervasyon iptallerinin önceden tahmin edilmesinin, turizm sektöründe karar destek sistemlerine entegre edilebilecek anlamlı öngörüler sunduğunu göstermektedir.

Ethical Statement

Bu makale Araştırma ve Yayın Etiğine uygundur. Beyan edilecek herhangi bir çıkar çatışması yoktur. Araştırmanın ortaya konulmasında herhangi bir mali destek alınmamıştır. Makale yazım ve intihal/benzerlik açısından kontrol edilmiştir. Makale, “en az iki dış hakem” ve “çift taraflı körleme” yöntemi ile değerlendirilmiştir. Yazar, dergiye imzalı “Telif Devir Formu” belgesi göndermişlerdir. Mevcut çalışma için mevzuat gereği etik izni alınmaya ihtiyaç yoktur. Bu konuda yazar tarafından dergiye “Etik İznine Gerek Olmadığına Dair Beyan Formu” gönderilmiştir. Yazar, çalışmanın tüm bölümlerine ve aşamalarına tek başına katkıda bulunmuştur.

Supporting Institution

Araştırmanın ortaya konulmasında herhangi bir mali destek alınmamıştır.

References

  • ANTONIO, Nuno, ALMEIDA, Ana de ve NUNES, Luis (2017), “Predicting Hotel Bookings Cancellation with a Machine Learning Classification Model”, 16th IEEE International Conference on Machine Learning and Applications (ICMLA), 18-21 December 2017 – Cansun, IEEE Publisher, New York, ss.1049-1054.
  • ANTONIO, Nuno, ALMEIDA, Ana de ve NUNES, Luis (2019), “Hotel Booking Demand Datasets”, Data in Brief, S.22, ss.41-49.
  • ASLAN, Kaan (2025), Yapay Zekâ, Makine Öğrenmesi ve Veri Bilimi Kursu, Sınıfta Yapılan Örnekler ve Özet Notlar, C ve Sistem Programcıları Derneği Yayını, İstanbul.
  • BOZ, Mehmet, CANBAZOĞLU, Erokan, ÖZEN, Zeki ve GÜLSEÇEN, Sevinç (2018), “Otel Rezervasyon İptallerinin Makine Öğrenmesi Yöntemleri ile Tahmin Edilmesi”, Veri Bilimi, S.1(1), ss.7-14.
  • CAGGIA, Caitlyn (2021), “Forecasting Hotel Reservation Cancellations with Machine Learning”, Lodging Magazine (E-Article), 10 March 2021, https://www.lodgingmagazine.com/forecasting-hotel-reservation-cancellations-with-machine-learning/ (Erişim Tarihi: 14.07.2025).
  • CHATFIELD, Christopher (1995), Problem Solving: A Statistician’s Guide, Chapman & Hall Publisher, Londra, 2nd Edition.
  • CHEN, Tianqi ve GUESTRIN, Carlos (2016), “XGBoost: A scalable Tree Boosting System”, Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 13-17 August 2016 – San Francisco, Association for Computing Machinery Publisher, New York, ss.785-794.
  • ERCAN, Uğur ve IRMAK, Sezgin (2022), “Turizm Endüstrisinde Otel Rezervasyon İptallerinin Makine Öğrenmesi Yöntemleri ile Tahmini”, Journal of Gastronomy, Hospitality and Travel, S.5(1), ss.45-54.
  • EŞİDİR, Kamil Abdullah (2025a), “Makine Öğrenimi Modelleri İle Yetişkin Eğitimi Analizi: Modellerin Karşılaştırmalı Performansı”, Elektronik Sosyal Bilimler Dergisi, S.24(2), ss.946-964.
  • EŞİDİR, Kamil Abdullah (2025b), “Video Oyunları Kullanıcı Yorumlarının Makine Öğrenmesi İle Tahmini: Veri Bilimi Perspektifinden Bir İnceleme”, MTÜ Sosyal ve Beşeri Bilimler Dergisi, S.5(1), ss.97-108.
  • FERNHOLZ, Luisa T. ve MORGENTHALER, Stephan (2000), “A Conversation with John W. Tukey and Elizabeth Tukey”, Statistical Science, S.15(1), ss.79-94.
  • JISHAN, Md Asifuzzaman., SINGH, Vikas, GHOSH, Ayan Kumar, ALAM, Md Shahabub, MAHMUD, Khan Raqib ve PAUL, Bijan (2024), “Hotel Booking Cancellation Prediction Using Applied Bayesian Models”, arXiv Preprint (E-Article), 21 October 2024, https://arxiv.org/abs/2410.16406 (Erişim Tarihi: 14.07.2025).
  • KARACA, Şükran ve AKIN, Mehmet Halit (2025), “Turizmde Makine Öğrenmesi ile İlgili Ulusal Yazındaki Çalışmaların Bibliyometrik Analizi”, TURAR Turizm ve Araştırma Dergisi, S.14(1), ss.169-195.
  • KE, Guolin, MENG, Qi, FINLEY, Thomas, WANG, Taifeng, CHEN, Wei, MA, Weidong, YE, Qiwei ve LIU, Tie-Yan (2017), “Light GBM: A Highly Efficient Gradient Boosting Decision Tree”, Advances in Neural Information Processing Systems, S.30, ss.3146-3154.
  • MOSTIPAK, Jesse (2018), “Hotel Booking Demand”, Kaggle (E-Article), https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand (Erişim Tarihi: 14.07.2025).
  • OGUINE, Ozioma Collins ve OGUINE, Kanyifeechukwu Jane, OKORIE, Chukwudindu I. ve OGUINE, Munachimso Blessing (2021), “Comparative Analysis and Forecasting on the Death Rate of COVID-19 Patients in Nigeria Using Random Forest and Multinomial Bayesian Epidemiological Models”, Journal of Clinical Case Studies, Reviews & Reports, S.3(4), ss.1-7.
  • PROKHORENKOVA, Liudmila, GUSEV, Gleb, VOROBEV, Aleksandr, DOROGUSH, Anna Veronika ve GULIN, Andrey (2018), “CatBoost: Unbiased Boosting with Categorical Features”, Advances in Neural Information Processing Systems, S.31, ss.6639-6649.
  • ŞAHİNBAŞ, Kevser ve DOĞUÇ, Özge (2022), “Otel Rezervasyon İptal Tahmin Modelinin Veri Madenciliği Algoritmaları ile Uygulanması”, Selçuk Turizm ve Bilişim Araştırmaları Dergisi, S.1(2), ss.15-24.
  • WANG, Liyang., WANG, Xiaoya, CHEN, Angxuan, JIN, Xian ve CHE, Huilian (2020), “Prediction of Type 2 Diabetes Risk and its Effect Evaluation Based on the Xgboost Mode”, Healthcare, S.8(3), ss.(247).

Predicting Hotel Reservation Cancellations with Data Science: SHAP-Based Explainability and Performance Analysis

Year 2025, Volume: 8 Issue: 3, 767 - 785, 15.10.2025
https://doi.org/10.33712/mana.1737947

Abstract

The effectiveness of revenue management and operational planning in the tourism sector largely depends on the ability to accurately predict reservation cancellations. This study aims to predict hotel reservation cancellations using machine learning-based models. An open-access dataset entitled “Hotel Booking Demand”, consisting of 119,390 observations from 2015 to 2017, is employed as the primary data source. To address the class imbalance problem, the SMOTE technique is applied. Prediction tasks are carried out using four models: Random Forest, XGBoost, LightGBM, and CatBoost. These models are compared based on multiple evaluation metrics including accuracy, AUC, F1-score, and training time. The Random Forest model achieves the highest performance with an accuracy of 81% and an AUC score of 0.89. The model’s decision-making processes are interpreted using SHAP analysis, which reveals that variables such as “lead_time”, “adr”, and “hotel” are particularly influential. The findings indicate that early prediction of reservation cancellations can provide valuable insights for the integration of data-driven decision support systems in the tourism industry.

Ethical Statement

This paper complies with Research and Publication Ethics, has no conflict of interest to declare, and has received no financial support. The article has been checked for spelling and plagiarism/similarity. The article was evaluated by "at least two external referees" and "double blinding" method. The author sent a signed "Copyright Transfer Form" to the journal. There is no need to obtain ethical permission for the current study as per the legislation. The "Declaration Form Regarding No Ethics Permission Required" was sent to the journal by the author on this subject. The author contributed to all sections and stages of the study alone.

Supporting Institution

No financial support was received for the conduct of the research.

References

  • ANTONIO, Nuno, ALMEIDA, Ana de ve NUNES, Luis (2017), “Predicting Hotel Bookings Cancellation with a Machine Learning Classification Model”, 16th IEEE International Conference on Machine Learning and Applications (ICMLA), 18-21 December 2017 – Cansun, IEEE Publisher, New York, ss.1049-1054.
  • ANTONIO, Nuno, ALMEIDA, Ana de ve NUNES, Luis (2019), “Hotel Booking Demand Datasets”, Data in Brief, S.22, ss.41-49.
  • ASLAN, Kaan (2025), Yapay Zekâ, Makine Öğrenmesi ve Veri Bilimi Kursu, Sınıfta Yapılan Örnekler ve Özet Notlar, C ve Sistem Programcıları Derneği Yayını, İstanbul.
  • BOZ, Mehmet, CANBAZOĞLU, Erokan, ÖZEN, Zeki ve GÜLSEÇEN, Sevinç (2018), “Otel Rezervasyon İptallerinin Makine Öğrenmesi Yöntemleri ile Tahmin Edilmesi”, Veri Bilimi, S.1(1), ss.7-14.
  • CAGGIA, Caitlyn (2021), “Forecasting Hotel Reservation Cancellations with Machine Learning”, Lodging Magazine (E-Article), 10 March 2021, https://www.lodgingmagazine.com/forecasting-hotel-reservation-cancellations-with-machine-learning/ (Erişim Tarihi: 14.07.2025).
  • CHATFIELD, Christopher (1995), Problem Solving: A Statistician’s Guide, Chapman & Hall Publisher, Londra, 2nd Edition.
  • CHEN, Tianqi ve GUESTRIN, Carlos (2016), “XGBoost: A scalable Tree Boosting System”, Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 13-17 August 2016 – San Francisco, Association for Computing Machinery Publisher, New York, ss.785-794.
  • ERCAN, Uğur ve IRMAK, Sezgin (2022), “Turizm Endüstrisinde Otel Rezervasyon İptallerinin Makine Öğrenmesi Yöntemleri ile Tahmini”, Journal of Gastronomy, Hospitality and Travel, S.5(1), ss.45-54.
  • EŞİDİR, Kamil Abdullah (2025a), “Makine Öğrenimi Modelleri İle Yetişkin Eğitimi Analizi: Modellerin Karşılaştırmalı Performansı”, Elektronik Sosyal Bilimler Dergisi, S.24(2), ss.946-964.
  • EŞİDİR, Kamil Abdullah (2025b), “Video Oyunları Kullanıcı Yorumlarının Makine Öğrenmesi İle Tahmini: Veri Bilimi Perspektifinden Bir İnceleme”, MTÜ Sosyal ve Beşeri Bilimler Dergisi, S.5(1), ss.97-108.
  • FERNHOLZ, Luisa T. ve MORGENTHALER, Stephan (2000), “A Conversation with John W. Tukey and Elizabeth Tukey”, Statistical Science, S.15(1), ss.79-94.
  • JISHAN, Md Asifuzzaman., SINGH, Vikas, GHOSH, Ayan Kumar, ALAM, Md Shahabub, MAHMUD, Khan Raqib ve PAUL, Bijan (2024), “Hotel Booking Cancellation Prediction Using Applied Bayesian Models”, arXiv Preprint (E-Article), 21 October 2024, https://arxiv.org/abs/2410.16406 (Erişim Tarihi: 14.07.2025).
  • KARACA, Şükran ve AKIN, Mehmet Halit (2025), “Turizmde Makine Öğrenmesi ile İlgili Ulusal Yazındaki Çalışmaların Bibliyometrik Analizi”, TURAR Turizm ve Araştırma Dergisi, S.14(1), ss.169-195.
  • KE, Guolin, MENG, Qi, FINLEY, Thomas, WANG, Taifeng, CHEN, Wei, MA, Weidong, YE, Qiwei ve LIU, Tie-Yan (2017), “Light GBM: A Highly Efficient Gradient Boosting Decision Tree”, Advances in Neural Information Processing Systems, S.30, ss.3146-3154.
  • MOSTIPAK, Jesse (2018), “Hotel Booking Demand”, Kaggle (E-Article), https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand (Erişim Tarihi: 14.07.2025).
  • OGUINE, Ozioma Collins ve OGUINE, Kanyifeechukwu Jane, OKORIE, Chukwudindu I. ve OGUINE, Munachimso Blessing (2021), “Comparative Analysis and Forecasting on the Death Rate of COVID-19 Patients in Nigeria Using Random Forest and Multinomial Bayesian Epidemiological Models”, Journal of Clinical Case Studies, Reviews & Reports, S.3(4), ss.1-7.
  • PROKHORENKOVA, Liudmila, GUSEV, Gleb, VOROBEV, Aleksandr, DOROGUSH, Anna Veronika ve GULIN, Andrey (2018), “CatBoost: Unbiased Boosting with Categorical Features”, Advances in Neural Information Processing Systems, S.31, ss.6639-6649.
  • ŞAHİNBAŞ, Kevser ve DOĞUÇ, Özge (2022), “Otel Rezervasyon İptal Tahmin Modelinin Veri Madenciliği Algoritmaları ile Uygulanması”, Selçuk Turizm ve Bilişim Araştırmaları Dergisi, S.1(2), ss.15-24.
  • WANG, Liyang., WANG, Xiaoya, CHEN, Angxuan, JIN, Xian ve CHE, Huilian (2020), “Prediction of Type 2 Diabetes Risk and its Effect Evaluation Based on the Xgboost Mode”, Healthcare, S.8(3), ss.(247).
There are 19 citations in total.

Details

Primary Language Turkish
Subjects Big Data, Data Mining and Knowledge Discovery, Data Engineering and Data Science, Data Management and Data Science (Other)
Journal Section Articles
Authors

Kamil Abdullah Eşidir 0000-0002-8106-1758

Publication Date October 15, 2025
Submission Date July 14, 2025
Acceptance Date October 8, 2025
Published in Issue Year 2025 Volume: 8 Issue: 3

Cite

APA Eşidir, K. A. (2025). Veri Bilimi ile Otel Rezervasyon İptallerinin Tahmini: SHAP Tabanlı Açıklanabilirlik ve Performans Analizi. Uluslararası Yönetim Akademisi Dergisi, 8(3), 767-785. https://doi.org/10.33712/mana.1737947

Creative Commons Lisansı
This work (journal) is lisenced under a Creative Commons Attribution-NonCommercial-No Derivative 4.0 International License.