Περίληψη : | Το αντικείμενο της παρούσας διπλωματικής εργασίας είναι η εξόρυξη γνώσης από πραγματικά δεδομένα μίας ελληνικής ηλεκτρονικής πλατφόρμας διανομής φαγητού. Οι τεχνικές που χρησιμοποιούνται είναι η τμηματοποίηση των πελατών και η δημιουργία μοντέλου πρόβλεψης των διαφυγόντων πελατών. Το σύνολο δεδομένων που εξετάζεται διατέθηκε από την εταιρεία και αφορά το χρονικό διάστημα από τον Ιούνιο του 2021 έως τον Ιούνιο του 2022 και απαριθμεί 1.313.353 παραγγελίες, οι οποίες πραγματοποιήθηκαν από 24.943 μοναδικούς πελάτες. Η τμηματοποίηση των πελατών πραγματοποιήθηκε με RFM ανάλυση, κατηγοριοποιώντας τους σε συστάδες βάσει της συχνότητας πραγματοποίησης παραγγελιών, του πόσο πρόσφατα ολοκλήρωσαν την τελευταία τους παραγγελία καθώς και των ποσών που ξοδεύουν κατά τη συναλλαγή τους. Ακολουθεί ο σχολιασμός των ομάδων πελάτων που προέκυψαν. Η τμηματοποίηση συμβάλλει στην αναγνώριση των κοινών χαρακτηριστικών των πελατών για τη δημιουργία στοχευμένων και εξατομικευμένων στρατηγικών μάρκετινγκ. Η πρόβλεψη των διαφυγόντων πελατών (churn prediction) πραγματοποιήθηκε με την υλοποίηση μοντέλων πρόβλεψης στην πλατφόρμα SAS Viya και πιο συγκεκριμένα στο SAS Model Studio. Προτού φορτωθεί το σύνολο δεδομένων στην πλατφόρμα, πραγματοποιήθηκε επεξεργασία των δεδομένων ώστε να αποκτήσουν μορφή κατάλληλη για ανάλυση. Έπειτα από έλεγχο της ακρίβειας των προβλεπτικών μοντέλων, επιλέχθηκαν το δένδρο απόφασης και η λογιστική παλινδρόμηση τα οποία εμφάνιζαν τα μικρότερα ποσοστά λάθους. Ακολούθησε η παραμετροποίηση των μοντέλων, ενώ στη συνέχεια δόθηκε η ερμηνεία τους και πραγματοποιήθηκε αξιολόγηση των αποτελεσμάτων. Τέλος, αναλύονται τα εξαχθέντα συμπεράσματα και γίνεται αναφορά στους περιορισμούς που προέκυψαν κατά την εκπόνηση της εργασίας. Η επίλυση των περιορισμών συνεπάγεται την επέκταση και τη βελτίωση των αποτελεσμάτων της παρούσας διπλωματικής. The object of this thesis is the extraction of knowledge from real data of a Greek online food delivery platform. The techniques used are the segmentation of customers and the creation of a model for predicting customer churn. The data set examined was provided by the company and covers the period from June 2021 to June 2022 and lists 1.313.353 orders, made by 24.943 unique customers.Customers were segmented using RFM analysis, categorizing them into clusters based on how often they made orders, how recently they completed their last order, and how much they spend during their transaction. The following is a commentary on the resulting customer clusters. Segmentation helps in the identification of common customer characteristics for the creation of targeted and personalized marketing strategies.The churn prediction was carried out by implementing prediction models in the SAS Viya platform and more specifically in SAS Model Studio. Before the data set was uploaded to the platform, the data was processed to obtain a format suitable for analysis. After checking the accuracy of the predictive models, the decision tree and logistic regression were selected, which showed the lowest error rates. The models were then parameterized, followed by their interpretation and an evaluation of the results.Finally, the conclusions drawn are analyzed and the limitations that emerged during the preparation of the study are mentioned. The resolution of the limitations implies the extension and improvement of the results of this thesis. SAS Model Studio
|
---|