Εντοπίστηκε ένα σφάλμα στη λειτουργία της ΠΥΞΙΔΑΣ όταν χρησιμοποιείται μέσω του προγράμματος περιήγησης Safari. Μέχρι να αποκατασταθεί το πρόβλημα, προτείνουμε τη χρήση εναλλακτικού browser όπως ο Chrome ή ο Firefox. A bug has been identified in the operation of the PYXIDA platform when accessed via the Safari browser. Until the problem is resolved, we recommend using an alternative browser such as Chrome or Firefox.
 

Predictive models for hotel booking cancellation

Μικρογραφία εικόνας

Ημερομηνία

11/10/2023

Συγγραφείς

Arseniou, Evangelia
Αρσενίου, Ευαγγελία

Τίτλος Εφημερίδας

Περιοδικό ISSN

Τίτλος τόμου

Εκδότης

Επιβλέπων

Διαθέσιμο από

2023-11-22 20:39:52

Περίληψη

Room cancellations pose a big challenge to the hotel industry, as the number of guests directly affects the entire operational framework. The primary purpose of the thesis is to predict hotel booking cancellations using machine learning techniques and analyze the most influential factors driving these cancellations. The problem of predicting cancellations is a binary classification problem, classifying outcomes as either cancellations or non-cancellations. The data are sourced from two hotels in Portugal, including a city hotel and a resort hotel. The implementation of machine learning algorithms, specifically Decision Trees, Random Forest, and Logistic Regression, was conducted using the R programming language. The key findings highlight Random Forest as the best-performing model, achieving an accuracy of 85% on the hotel dataset. The lead time was the most influential, followed by region and total of special requests. Additionally, Multiple Linear Regression was used to predict the guests’ duration of stay. However, the observed low adjusted R-squared value and the violation of residual assumptions indicate limited predictive efficacy. The final phase of the research involved applying K-means clustering for customer segmentation, a pivotal step in making effective business decisions. The resulting analysis yielded four distinct clusters, each offering valuable insights into customer behavior and preferences.
Οι ακυρώσεις δωματίων αποτελούν μεγάλη πρόκληση για τον ξενοδοχειακό κλάδο, καθώς ο αριθμός των επισκεπτών επηρεάζει άμεσα ολόκληρο το επιχειρησιακό πλαίσιο. Ο πρωταρχικός σκοπός της διπλωματικής εργασίας είναι η πρόβλεψη των ακυρώσεων κρατήσεων ξενοδοχείων χρησιμοποιώντας τεχνικές μηχανικής μάθησης και η ανάλυση των πιο σημαντικών παραγόντων που οδηγούν σε αυτές τις ακυρώσεις. Το πρόβλημα της πρόβλεψης των ακυρώσεων είναι ένα binary classification πρόβλημα, καθώς τα αποτελέσματα ταξινομούνται είτε ως ακυρώσεις είτε ως μη ακυρώσεις. Τα δεδομένα προέρχονται από δύο ξενοδοχεία στην Πορτογαλία, συμπεριλαμβανομένου ενός ξενοδοχείου πόλης και ενός ξενοδοχείου θέρετρου. Η εφαρμογή αλγορίθμων μηχανικής μάθησης, και πιο συγκεκριμένα των Decision Trees, Random Forest, και Logistic Regression, διεξήχθη χρησιμοποιώντας τη γλώσσα προγραμματισμού R. Τα βασικά ευρήματα δείχνουν το Random Forest ως το μοντέλο με τις καλύτερες επιδόσεις, επιτυγχάνοντας ακρίβεια 85% στο σύνολο δεδομένων των ξενοδοχείων. Η μεταβλητή lead time ήταν η πιο σημαντική, με το region και το total of special requests να ακολουθούν. Επιπλέον, χρησιμοποιήθηκε πολλαπλή γραμμική παλινδρόμηση για την πρόβλεψη της διάρκειας παραμονής των επισκεπτών. Η παρατηρούμενη χαμηλή τιμή adjusted R-squared και η παραβίαση των υποθέσεων των καταλοίπων υποδεικνύουν περιορισμένη προγνωστική αποτελεσματικότητα. Το τελευταίο κομμάτι της έρευνας αφορούσε την εφαρμογή του αλγορίθμου K-Means για την ταξινόμηση των πελατών, ένα βασικό βήμα για τη λήψη αποτελεσματικών επιχειρηματικών αποφάσεων. Από την ανάλυση προέκυψαν τέσσερα ξεχωριστά clusters, όπου το καθένα προσφέρει πολύτιμες γνώσεις σχετικά με τη συμπεριφορά και τις προτιμήσεις των πελατών.

Περιγραφή

Λέξεις-κλειδιά

Machine learning, Hotel industry, Booking cancellations, Predictive analytics, Decision tree, Random forest, Logistic regression, K-Means algorithm, Μηχανική μάθηση, Ξενοδοχειακός κλάδος, Ακυρώσεις κρατήσεων, Ανάλυση προβλέψεων, Δέντρα απόφασης, Τυχαίο δάσος, Λογιστική παλινδρόμηση, Αλγόριθμος K-Μέσων

Παραπομπή

Άδεια Creative Commons