Περίληψη : | Ο σκοπός της διπλωματικής εργασίας ήταν η εξόρυξη γνώσης με τεχνικές τμηματοποίησης πελατών και η υλοποίηση μοντέλου πρόβλεψης πιστότητας πελατών. Οι μεθοδολογίες αυτές εφαρμόστηκαν σε δεδομένα ψηφιακής πλατφόρμας διανομής φαγητού, που παρέχει υπηρεσίες delivery στην Ελλάδα. Τα δεδομένα που εξετάστηκαν αφορούν το διάστημα από τον Αύγουστο του 2021 έως και τον Αύγουστο του 2022, ενώ το σύνολο δεδομένων περιέχει 19.481 καταστήματα. Για την τμηματοποίηση χρησιμοποιήθηκαν οι αλγόριθμοι k-means σε αριθμητικές μεταβλητές και k-prototypes, σε συνδυασμό αριθμητικών και κατηγορικών μεταβλητών. Στη συνέχεια πραγματοποιήθηκε χαρακτηρισμός των τμημάτων-συστάδων που προέκυψαν με βάση τα κοινά χαρακτηριστικά τους. Η τμηματοποίηση των καταστημάτων θεωρείται ιδιαίτερα σημαντική καθώς δίνει τη δυνατότητα εστίασης σε καταστήματα-πελάτες με παρούσα ή μελλοντική υψηλή αξία για την πλατφόρμα, και συνεπώς τη δημιουργία κινήτρων για τα καταστήματα αυτά. Η υλοποίηση των μοντέλων πρόβλεψης πιστότητας πραγματοποιήθηκε με σκοπό τον προσδιορισμό των κυριότερων παραγόντων που οδηγούν ένα κατάστημα σε αποχώρηση από την ψηφιακή πλατφόρμα διανομής φαγητού. Αρχικά η υλοποίηση περιέλαβε δέντρα αποφάσεων, random forest, νευρωνικά δίκτυα και λογιστική παλινδρόμηση. Η ακρίβεια και η δυνατότητα ερμηνείας οδήγησε σε επιλογή του δέντρου απόφασης και της λογιστικής παλινδρόμησης. Έπειτα ακολούθησε επεξεργασία των δεδομένων και παραμετροποίηση των μοντέλων, ενώ στη συνέχεια δόθηκε η ερμηνεία τους και η αξιολόγησή τους. Η διατήρηση των καταστημάτων που πρόκειται να αποχωρήσουν αποτελεί μια μεγάλη πρόκληση για μια ψηφιακή πλατφόρμα διανομής φαγητού, ιδιαίτερα λόγω της όξυνσης του ανταγωνισμού στη συγκεκριμένη αγορά. Για το λόγο αυτό, κρίνεται σκόπιμη η παρακολούθηση των σημαντικότερων χαρακτηριστικών που οδηγούν σε πρόβλεψη για αποχώρηση, ιδιαίτερα αν πρόκειται για καταστήματα υψηλής αξίας για την πλατφόρμα. The scope of this thesis was the use of data mining techniques such as clustering and churn prediction models for an online delivery platform operating in Greece. The available data were obtained from August 2021 until August 2022 and contained 19.481 shops. Clustering was done twice, with the implementation of k-means algorithm for numeric variables, and k-prototypes algorithm for both numeric and categorical variables. The next step was to profile the resulting clusters, which is considered particularly important as it creates a focus point on high value shops. Thus, the business can then provide essential incentives for their growth, whilst increasing its revenue. The development of churn prediction models was carried out in order to determine the main factors that lead to customer attrition from the digital platform. Initially, the implementation included decision trees, random forest, neural networks and logistic regression. Accuracy and interpretability led to the selection of the decision tree and logistic regression as the main models. Data processing and parameter tuning was done before the interpretation and evaluation of the selected models. Exploiting these prediction models to retain customers as part of a proactive approach seems like a big challenge for this kind of digital platforms, while competition is fierce in the same market. Consequently, it is advisable to monitor the most critical attributes that lead to churning customers and target them with special programs or incentives, especially if they are classified as high-value customers.
|
---|