Turizm sektöründe gelir yönetimi ve operasyonel planlamanın etkinliği, rezervasyon iptallerinin doğru şekilde tahmin edilmesine bağlıdır. Bu çalışmada, otel rezervasyon iptallerinin makine öğrenmesi temelli modeller aracılığıyla öngörülmesi amaçlanmıştır. Veri kaynağı olarak, 2015–2017 dönemine ait 119.390 gözlemden oluşan açık erişimli “Hotel Booking Demand” veri kümesi kullanılmıştır. Sınıf dengesizliği problemi SMOTE yöntemiyle giderilmiş; Random Forest, XGBoost, LightGBM ve CatBoost modelleri ile tahminlemeler gerçekleştirilmiştir. Modeller; doğruluk, AUC, F1 skoru ve özellikle eğitim süresi gibi performans metrikleriyle karşılaştırılmıştır. En yüksek doğruluk oranı (%81) ve AUC skoru (0,89) Random Forest modeliyle elde edilmiştir. Modelin karar süreçleri SHAP analiziyle açıklanmış; özellikle “lead_time”, “adr” ve “hotel” değişkenlerinin belirleyici olduğu tespit edilmiştir. Bulgular, rezervasyon iptallerinin önceden tahmin edilmesinin, turizm sektöründe karar destek sistemlerine entegre edilebilecek anlamlı öngörüler sunduğunu göstermektedir.
Bu makale Araştırma ve Yayın Etiğine uygundur. Beyan edilecek herhangi bir çıkar çatışması yoktur. Araştırmanın ortaya konulmasında herhangi bir mali destek alınmamıştır. Makale yazım ve intihal/benzerlik açısından kontrol edilmiştir. Makale, “en az iki dış hakem” ve “çift taraflı körleme” yöntemi ile değerlendirilmiştir. Yazar, dergiye imzalı “Telif Devir Formu” belgesi göndermişlerdir. Mevcut çalışma için mevzuat gereği etik izni alınmaya ihtiyaç yoktur. Bu konuda yazar tarafından dergiye “Etik İznine Gerek Olmadığına Dair Beyan Formu” gönderilmiştir. Yazar, çalışmanın tüm bölümlerine ve aşamalarına tek başına katkıda bulunmuştur.
Araştırmanın ortaya konulmasında herhangi bir mali destek alınmamıştır.
The effectiveness of revenue management and operational planning in the tourism sector largely depends on the ability to accurately predict reservation cancellations. This study aims to predict hotel reservation cancellations using machine learning-based models. An open-access dataset entitled “Hotel Booking Demand”, consisting of 119,390 observations from 2015 to 2017, is employed as the primary data source. To address the class imbalance problem, the SMOTE technique is applied. Prediction tasks are carried out using four models: Random Forest, XGBoost, LightGBM, and CatBoost. These models are compared based on multiple evaluation metrics including accuracy, AUC, F1-score, and training time. The Random Forest model achieves the highest performance with an accuracy of 81% and an AUC score of 0.89. The model’s decision-making processes are interpreted using SHAP analysis, which reveals that variables such as “lead_time”, “adr”, and “hotel” are particularly influential. The findings indicate that early prediction of reservation cancellations can provide valuable insights for the integration of data-driven decision support systems in the tourism industry.
This paper complies with Research and Publication Ethics, has no conflict of interest to declare, and has received no financial support. The article has been checked for spelling and plagiarism/similarity. The article was evaluated by "at least two external referees" and "double blinding" method. The author sent a signed "Copyright Transfer Form" to the journal. There is no need to obtain ethical permission for the current study as per the legislation. The "Declaration Form Regarding No Ethics Permission Required" was sent to the journal by the author on this subject. The author contributed to all sections and stages of the study alone.
No financial support was received for the conduct of the research.
Primary Language | Turkish |
---|---|
Subjects | Big Data, Data Mining and Knowledge Discovery, Data Engineering and Data Science, Data Management and Data Science (Other) |
Journal Section | Articles |
Authors | |
Publication Date | October 15, 2025 |
Submission Date | July 14, 2025 |
Acceptance Date | October 8, 2025 |
Published in Issue | Year 2025 Volume: 8 Issue: 3 |
Creative Commons Lisansı
This work (journal) is lisenced under a Creative Commons Attribution-NonCommercial-No Derivative 4.0 International License.