Συλλογές
Τίτλος Performance measures of clustering algorithms in retail industry
Εναλλακτικός τίτλος Δείκτες απόδοσης αλγορίθμων ομαδοποίησης στον κλάδο του λιανικού εμπορίου
Δημιουργός Liapikos, Ilias
Συντελεστής Athens University of Economics and Business, Department of Informatics
Βρόντος, Ιωάννης
Βασσάλος, Βασίλειος
Karlis, Dimitrios
Τύπος Text
Φυσική περιγραφή 59 p.
Γλώσσα en
Αναγνωριστικό http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=5320
Περίληψη Cluster analysis (more often clustering) is a very powerful tool in a variety of fields:Statistics, social sciences, biology, machine learning, data mining and data reduction are significant representatives, with the latter being an example where clustering is not used as a stand-alone procedure but as a first step towards the goal. Despite the diversity of its applications, the core objective of clustering is to identify structures of similar objects inside vast datasets. The lack of knowledge of the exact result we try to identify, constitutes the part of clustering result validation the most crucial one.In the current thesis, we present a brief description of the most used clustering algorithms along with the novelty they introduce to the procedure. We then make a strong effort to cover all the different approaches on the matter of Clustering Validation and how the nature of our problem defines the appropriate validity index. Following the theoretic approach, a comparative analysis in terms of result validation is implemented by an appliance of five different clustering algorithms in synthetic data sets. Finally, an approach on how clustering quality indices can be used in real product data is presented and evaluated.
Η μέθοδος της ομαδοποίησης (clustering) ως τεχνική ανάλυσης δεδομένων είναι εν γένει μια μη-εποπτευόμενη τεχνική. Ως εκ τούτου, εγείρεται η ανάγκη για μια ποιοτική αποτίμηση του αποτελέσματος ενός αλγορίθμου ομαδοποίησης. Στην παρούσα διπλωματική εργασία, γίνεται μια αποτύπωση των πιο διαδεδομένων δεικτών εγκυρότητας (validity measures), καθώς και μια συγκριτική μελέτη των πιο σύγχρονων αλγορίθμων σε μια ποικιλία συνθετικών δεδομένων. Τέλος αναπτύσσεται μια ad-hoc τεχνική για την ποιοτική αποτίμηση της ομαδοποίησης δεδομένων λιανικού εμπορίου με βάση τα ίδια χαρακτηριστικά των προϊόντων. Η τεχνική αυτή επιτρέπει την αναζήτηση του βέλτιστου χαρακτηριστικού με βάση συγκεκριμένο δείκτη απόδοσης και αποτυπώνει τις επιλογές αυτές στην μορφή ενός δένδρου απόφασης.
Λέξη κλειδί Δείκτες απόδοσης
Ομαδοποίηση
Αλγόριθμοι
Validity indices
Retail data
Clustering algorithms
Clustering
Performance measures
Διαθέσιμο από 2017-12-05 16:29:17
Ημερομηνία έκδοσης 10/20/2017
Ημερομηνία κατάθεσης 2017-12-05 16:29:17
Δικαιώματα χρήσης Free access
Άδεια χρήσης https://creativecommons.org/licenses/by-nc-sa/4.0/