PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :Predictive models for hotel booking cancellation
Alternative Title :Προβλεπτικά μοντέλα ακύρωσης κρατήσεων ξενοδοχείων
Creator :Arseniou, Evangelia
Αρσενίου, Ευαγγελία
Contributor :Ntzoufras, Ioannis (Επιβλέπων καθηγητής)
Karlis, Dimitrios (Εξεταστής)
Chatziantoniou, Damianos (Εξεταστής)
Athens University of Economics and Business, Department of Management Science and Technology (Degree granting institution)
Type :Text
Extent :134p.
Language :el
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=10850
Abstract :Room cancellations pose a big challenge to the hotel industry, as the number of guests directly affects the entire operational framework. The primary purpose of the thesis is to predict hotel booking cancellations using machine learning techniques and analyze the most influential factors driving these cancellations. The problem of predicting cancellations is a binary classification problem, classifying outcomes as either cancellations or non-cancellations. The data are sourced from two hotels in Portugal, including a city hotel and a resort hotel. The implementation of machine learning algorithms, specifically Decision Trees, Random Forest, and Logistic Regression, was conducted using the R programming language. The key findings highlight Random Forest as the best-performing model, achieving an accuracy of 85% on the hotel dataset. The lead time was the most influential, followed by region and total of special requests. Additionally, Multiple Linear Regression was used to predict the guests’ duration of stay. However, the observed low adjusted R-squared value and the violation of residual assumptions indicate limited predictive efficacy. The final phase of the research involved applying K-means clustering for customer segmentation, a pivotal step in making effective business decisions. The resulting analysis yielded four distinct clusters, each offering valuable insights into customer behavior and preferences.
Οι ακυρώσεις δωματίων αποτελούν μεγάλη πρόκληση για τον ξενοδοχειακό κλάδο, καθώς ο αριθμός των επισκεπτών επηρεάζει άμεσα ολόκληρο το επιχειρησιακό πλαίσιο. Ο πρωταρχικός σκοπός της διπλωματικής εργασίας είναι η πρόβλεψη των ακυρώσεων κρατήσεων ξενοδοχείων χρησιμοποιώντας τεχνικές μηχανικής μάθησης και η ανάλυση των πιο σημαντικών παραγόντων που οδηγούν σε αυτές τις ακυρώσεις. Το πρόβλημα της πρόβλεψης των ακυρώσεων είναι ένα binary classification πρόβλημα, καθώς τα αποτελέσματα ταξινομούνται είτε ως ακυρώσεις είτε ως μη ακυρώσεις. Τα δεδομένα προέρχονται από δύο ξενοδοχεία στην Πορτογαλία, συμπεριλαμβανομένου ενός ξενοδοχείου πόλης και ενός ξενοδοχείου θέρετρου. Η εφαρμογή αλγορίθμων μηχανικής μάθησης, και πιο συγκεκριμένα των Decision Trees, Random Forest, και Logistic Regression, διεξήχθη χρησιμοποιώντας τη γλώσσα προγραμματισμού R. Τα βασικά ευρήματα δείχνουν το Random Forest ως το μοντέλο με τις καλύτερες επιδόσεις, επιτυγχάνοντας ακρίβεια 85% στο σύνολο δεδομένων των ξενοδοχείων. Η μεταβλητή lead time ήταν η πιο σημαντική, με το region και το total of special requests να ακολουθούν. Επιπλέον, χρησιμοποιήθηκε πολλαπλή γραμμική παλινδρόμηση για την πρόβλεψη της διάρκειας παραμονής των επισκεπτών. Η παρατηρούμενη χαμηλή τιμή adjusted R-squared και η παραβίαση των υποθέσεων των καταλοίπων υποδεικνύουν περιορισμένη προγνωστική αποτελεσματικότητα. Το τελευταίο κομμάτι της έρευνας αφορούσε την εφαρμογή του αλγορίθμου K-Means για την ταξινόμηση των πελατών, ένα βασικό βήμα για τη λήψη αποτελεσματικών επιχειρηματικών αποφάσεων. Από την ανάλυση προέκυψαν τέσσερα ξεχωριστά clusters, όπου το καθένα προσφέρει πολύτιμες γνώσεις σχετικά με τη συμπεριφορά και τις προτιμήσεις των πελατών.
Subject :Machine learning
Hotel industry
Booking cancellations
Predictive analytics
Decision tree
Random forest
Logistic regression
K-Means algorithm
Μηχανική μάθηση
Ξενοδοχειακός κλάδος
Ακυρώσεις κρατήσεων
Ανάλυση προβλέψεων
Δέντρα απόφασης
Τυχαίο δάσος
Λογιστική παλινδρόμηση
Αλγόριθμος K-Μέσων
Date Available :2023-11-22 20:39:52
Date Issued :11/10/2023
Date Submitted :2023-11-22 20:39:52
Access Rights :Free access
Licence :

File: Arseniou_2023.pdf

Type: application/pdf