PYXIDA Institutional Repository
and Digital Library
Collections :

Title :Performance measures of clustering algorithms in retail industry
Alternative Title :Δείκτες απόδοσης αλγορίθμων ομαδοποίησης στον κλάδο του λιανικού εμπορίου
Creator :Liapikos, Ilias
Contributor :Karlis, Dimitrios (Επιβλέπων καθηγητής)
Βασσάλος, Βασίλειος (Εξεταστής)
Βρόντος, Ιωάννης (Εξεταστής)
Athens University of Economics and Business, Department of Informatics (Degree granting institution)
Type :Text
Extent :59 p.
Language :en
Identifier :
Abstract :Cluster analysis (more often clustering) is a very powerful tool in a variety of fields:Statistics, social sciences, biology, machine learning, data mining and data reduction are significant representatives, with the latter being an example where clustering is not used as a stand-alone procedure but as a first step towards the goal. Despite the diversity of its applications, the core objective of clustering is to identify structures of similar objects inside vast datasets. The lack of knowledge of the exact result we try to identify, constitutes the part of clustering result validation the most crucial one.In the current thesis, we present a brief description of the most used clustering algorithms along with the novelty they introduce to the procedure. We then make a strong effort to cover all the different approaches on the matter of Clustering Validation and how the nature of our problem defines the appropriate validity index. Following the theoretic approach, a comparative analysis in terms of result validation is implemented by an appliance of five different clustering algorithms in synthetic data sets. Finally, an approach on how clustering quality indices can be used in real product data is presented and evaluated.
Η μέθοδος της ομαδοποίησης (clustering) ως τεχνική ανάλυσης δεδομένων είναι εν γένει μια μη-εποπτευόμενη τεχνική. Ως εκ τούτου, εγείρεται η ανάγκη για μια ποιοτική αποτίμηση του αποτελέσματος ενός αλγορίθμου ομαδοποίησης. Στην παρούσα διπλωματική εργασία, γίνεται μια αποτύπωση των πιο διαδεδομένων δεικτών εγκυρότητας (validity measures), καθώς και μια συγκριτική μελέτη των πιο σύγχρονων αλγορίθμων σε μια ποικιλία συνθετικών δεδομένων. Τέλος αναπτύσσεται μια ad-hoc τεχνική για την ποιοτική αποτίμηση της ομαδοποίησης δεδομένων λιανικού εμπορίου με βάση τα ίδια χαρακτηριστικά των προϊόντων. Η τεχνική αυτή επιτρέπει την αναζήτηση του βέλτιστου χαρακτηριστικού με βάση συγκεκριμένο δείκτη απόδοσης και αποτυπώνει τις επιλογές αυτές στην μορφή ενός δένδρου απόφασης.
Subject :Performance measures
Validity indices
Retail data
Clustering algorithms
Δείκτες απόδοσης
Date Available :2017-12-05 16:29:17
Date Issued :10/20/2017
Date Submitted :2017-12-05 16:29:17
Access Rights :Free access
Licence :

File: Liapikos_2017.pdf

Type: application/pdf