AUEB Library - Digital Repository

PYXIDA Institutional Repository
and Digital Library

Username
Password

Collections :	Ιδρυματικό Αποθετήριο ΟΠΑ / AUEB Institutional Repository Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας / School of Informatics Τμήμα Στατιστικής / Department of Statistics Μεταπτυχιακές Εργασίες / Postgraduate dissertations

Title :	Segmentation of population (Clustering Analysis): case study analysis on banking data

Alternative Title :	Τμηματοποίηση πληθυσμού σε συστάδες (Clustering Analysis) : η περίπτωση βάσης πελατών στον τραπεζικό κλάδο

Creator :	Αργυροπούλου, Ευαγγελία

Contributor :	Psarakis, Stelios (Επιβλέπων καθηγητής) Athens University of Economics and Business, Department of Statistics (Degree granting institution)

Type :	Text

Extent :	57p.

Language :	en

Abstract :	Segmentation is a process of identifying sub-groups of people or organizations within a population sharing one or more characteristics that cause them to have similar product and/or service needs.The scope of this thesis is to group customers from banking data into different segments. Code was constructed to receive as input a table, where each row represented a customer. Options referring to the parameters are set as global variables and could be set from the beginning of the execution. Parameters related to k-means options, variable preparation, selection and reduction etc. Parameters could be adjusted and rerun the code, without losing information. Finally, after variable selection and segmetation analysis execution with the use of K-means algorithm, we proceed to profiling execution and evaluation of solution. Σκοπός της εργασίας είναι να κατασκευαστεί κώδικας που αναλύει τραπεζικά δεδομένα, να εντοπισθούν όσο το δυνατόν καλύτερα clusters, με ομοιογένεια των παρατηρήσεων (πελατών) μέσα στο cluster (within each cluster) και μέγιστη διαφορά των χαρακτηριστικών μεταξύ των clusters (between the clusters).Στο πλαίσιο της διπλωματικής εργασίας κατασκευάστηκε κώδικας, ο οποίος αποτελεί ένα ολοκληρωμένο εργαλείο που δέχεται στην είσοδο έναν πίνακα, όπου κάθε γραμμή περιγράφει την εικόνα κάθε πελάτη. Κώδικας παραμετροποιήσιμος από το χρήστη, δίνει τη δυνατότητα εύκολης επανεκτέλεσής με αλλαγές των ρυθμίσεων. Αλλαγές επιτρέπονται καθ’ όλη τη διάρκεια της διαδικασίας (προετοιμασία μεταβλητών , επιλογή μεταβλητών για το segmentation), και εισάγονται στην αρχικοποίηση της διαδικασίας. Η κεντροποίηση της εισαγωγής των παραμέτρων εξυπηρετεί στην πολλαπλή επανεκτέλεση του κώδικα και τον τρόπο μείωσης των μεταβλητών χωρίς να χάνεται πληροφορία (variable reduction μέσω variable clustering / PROC VARCLUS). Στην συνέχεια, τρέξιμο του segmentation (με χρήση του αλγορίθμου K-means) και αξιολόγηση της λύσης ως προς το σύνολο των δεδομένων.

Abstract :

Segmentation is a process of identifying sub-groups of people or organizations within a population sharing one or more characteristics that cause them to have similar product and/or service needs.The scope of this thesis is to group customers from banking data into different segments. Code was constructed to receive as input a table, where each row represented a customer. Options referring to the parameters are set as global variables and could be set from the beginning of the execution. Parameters related to k-means options, variable preparation, selection and reduction etc. Parameters could be adjusted and rerun the code, without losing information. Finally, after variable selection and segmetation analysis execution with the use of K-means algorithm, we proceed to profiling execution and evaluation of solution.
Σκοπός της εργασίας είναι να κατασκευαστεί κώδικας που αναλύει τραπεζικά δεδομένα, να εντοπισθούν όσο το δυνατόν καλύτερα clusters, με ομοιογένεια των παρατηρήσεων (πελατών) μέσα στο cluster (within each cluster) και μέγιστη διαφορά των χαρακτηριστικών μεταξύ των clusters (between the clusters).Στο πλαίσιο της διπλωματικής εργασίας κατασκευάστηκε κώδικας, ο οποίος αποτελεί ένα ολοκληρωμένο εργαλείο που δέχεται στην είσοδο έναν πίνακα, όπου κάθε γραμμή περιγράφει την εικόνα κάθε πελάτη. Κώδικας παραμετροποιήσιμος από το χρήστη, δίνει τη δυνατότητα εύκολης επανεκτέλεσής με αλλαγές των ρυθμίσεων. Αλλαγές επιτρέπονται καθ’ όλη τη διάρκεια της διαδικασίας (προετοιμασία μεταβλητών , επιλογή μεταβλητών για το segmentation), και εισάγονται στην αρχικοποίηση της διαδικασίας. Η κεντροποίηση της εισαγωγής των παραμέτρων εξυπηρετεί στην πολλαπλή επανεκτέλεση του κώδικα και τον τρόπο μείωσης των μεταβλητών χωρίς να χάνεται πληροφορία (variable reduction μέσω variable clustering / PROC VARCLUS). Στην συνέχεια, τρέξιμο του segmentation (με χρήση του αλγορίθμου K-means) και αξιολόγηση της λύσης ως προς το σύνολο των δεδομένων.

Subject :	Segmentation Clustering analysis K-means algorithm Banking systems

Date :	2017

Licence :

File: Argyropoulou_2017.pdf

Type: application/pdf

Login