Συλλογές | |
---|---|
Τίτλος |
Performance measures of clustering algorithms in retail industry |
Εναλλακτικός τίτλος |
Δείκτες απόδοσης αλγορίθμων ομαδοποίησης στον κλάδο του λιανικού εμπορίου |
Δημιουργός |
Liapikos, Ilias |
Συντελεστής |
Athens University of Economics and Business, Department of Informatics Βρόντος, Ιωάννης Βασσάλος, Βασίλειος Karlis, Dimitrios |
Τύπος |
Text |
Φυσική περιγραφή |
59 p. |
Γλώσσα |
en |
Αναγνωριστικό |
http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=5320 |
Περίληψη |
Cluster analysis (more often clustering) is a very powerful tool in a variety of fields:Statistics, social sciences, biology, machine learning, data mining and data reduction are significant representatives, with the latter being an example where clustering is not used as a stand-alone procedure but as a first step towards the goal. Despite the diversity of its applications, the core objective of clustering is to identify structures of similar objects inside vast datasets. The lack of knowledge of the exact result we try to identify, constitutes the part of clustering result validation the most crucial one.In the current thesis, we present a brief description of the most used clustering algorithms along with the novelty they introduce to the procedure. We then make a strong effort to cover all the different approaches on the matter of Clustering Validation and how the nature of our problem defines the appropriate validity index. Following the theoretic approach, a comparative analysis in terms of result validation is implemented by an appliance of five different clustering algorithms in synthetic data sets. Finally, an approach on how clustering quality indices can be used in real product data is presented and evaluated. Η μέθοδος της ομαδοποίησης (clustering) ως τεχνική ανάλυσης δεδομένων είναι εν γένει μια μη-εποπτευόμενη τεχνική. Ως εκ τούτου, εγείρεται η ανάγκη για μια ποιοτική αποτίμηση του αποτελέσματος ενός αλγορίθμου ομαδοποίησης. Στην παρούσα διπλωματική εργασία, γίνεται μια αποτύπωση των πιο διαδεδομένων δεικτών εγκυρότητας (validity measures), καθώς και μια συγκριτική μελέτη των πιο σύγχρονων αλγορίθμων σε μια ποικιλία συνθετικών δεδομένων. Τέλος αναπτύσσεται μια ad-hoc τεχνική για την ποιοτική αποτίμηση της ομαδοποίησης δεδομένων λιανικού εμπορίου με βάση τα ίδια χαρακτηριστικά των προϊόντων. Η τεχνική αυτή επιτρέπει την αναζήτηση του βέλτιστου χαρακτηριστικού με βάση συγκεκριμένο δείκτη απόδοσης και αποτυπώνει τις επιλογές αυτές στην μορφή ενός δένδρου απόφασης. |
Λέξη κλειδί |
Δείκτες απόδοσης Ομαδοποίηση Αλγόριθμοι Validity indices Retail data Clustering algorithms Clustering Performance measures |
Διαθέσιμο από |
2017-12-05 16:29:17 |
Ημερομηνία έκδοσης |
10/20/2017 |
Ημερομηνία κατάθεσης |
2017-12-05 16:29:17 |
Δικαιώματα χρήσης |
Free access |
Άδεια χρήσης |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |