Συλλογές
Τίτλος Segmentation of population (Clustering Analysis): case study analysis on banking data
Εναλλακτικός τίτλος Τμηματοποίηση πληθυσμού σε συστάδες (Clustering Analysis) : η περίπτωση βάσης πελατών στον τραπεζικό κλάδο
Δημιουργός Αργυροπούλου, Ευαγγελία
Συντελεστής Psarakis, Stelios
Athens University of Economics and Business, Department of Statistics
Τύπος Text
Φυσική περιγραφή 57p.
Γλώσσα en
Περίληψη Segmentation is a process of identifying sub-groups of people or organizations within a population sharing one or more characteristics that cause them to have similar product and/or service needs.The scope of this thesis is to group customers from banking data into different segments. Code was constructed to receive as input a table, where each row represented a customer. Options referring to the parameters are set as global variables and could be set from the beginning of the execution. Parameters related to k-means options, variable preparation, selection and reduction etc. Parameters could be adjusted and rerun the code, without losing information. Finally, after variable selection and segmetation analysis execution with the use of K-means algorithm, we proceed to profiling execution and evaluation of solution.
Σκοπός της εργασίας είναι να κατασκευαστεί κώδικας που αναλύει τραπεζικά δεδομένα, να εντοπισθούν όσο το δυνατόν καλύτερα clusters, με ομοιογένεια των παρατηρήσεων (πελατών) μέσα στο cluster (within each cluster) και μέγιστη διαφορά των χαρακτηριστικών μεταξύ των clusters (between the clusters).Στο πλαίσιο της διπλωματικής εργασίας κατασκευάστηκε κώδικας, ο οποίος αποτελεί ένα ολοκληρωμένο εργαλείο που δέχεται στην είσοδο έναν πίνακα, όπου κάθε γραμμή περιγράφει την εικόνα κάθε πελάτη. Κώδικας παραμετροποιήσιμος από το χρήστη, δίνει τη δυνατότητα εύκολης επανεκτέλεσής με αλλαγές των ρυθμίσεων. Αλλαγές επιτρέπονται καθ’ όλη τη διάρκεια της διαδικασίας (προετοιμασία μεταβλητών , επιλογή μεταβλητών για το segmentation), και εισάγονται στην αρχικοποίηση της διαδικασίας. Η κεντροποίηση της εισαγωγής των παραμέτρων εξυπηρετεί στην πολλαπλή επανεκτέλεση του κώδικα και τον τρόπο μείωσης των μεταβλητών χωρίς να χάνεται πληροφορία (variable reduction μέσω variable clustering / PROC VARCLUS). Στην συνέχεια, τρέξιμο του segmentation (με χρήση του αλγορίθμου K-means) και αξιολόγηση της λύσης ως προς το σύνολο των δεδομένων.
Λέξη κλειδί Banking systems
K-means algorithm
Segmentation
Clustering analysis
Ημερομηνία 2017
Άδεια χρήσης https://creativecommons.org/licenses/by/4.0/