Λογότυπο αποθετηρίου
 

Adjusted rand index in soft clustering

dc.aueb.departmentDepartment of Management Science and Technology
dc.aueb.programBusiness Analytics
dc.contributor.opponentPapastamoulis, Panagiotisen
dc.contributor.opponentChatziantoniou, Damianosen
dc.contributor.thesisadvisorKarlis, Dimitriosen
dc.creatorKalatzis, Viktoren
dc.creatorΚαλατζής, Βίκτωρel
dc.date.accessioned2025-05-07T08:28:21Z
dc.date.available2025-05-07T08:28:21Z
dc.date.issued2025-03-31
dc.description.abstractΗ αξιολόγηση της ποιότητας της ομαδοποίησης είναι αναμφισβήτητα σημαντική για τη μάθηση χωρίς επίβλεψη, ιδίως όταν πρόκειται για τη διεξοδική διαχείριση των μεθόδων ομαδοποίησης soft clustering. Ο προσαρμοσμένος δείκτης Rand (ARI) και πρόσθετα συνήθη μέτρα είναι αποτελεσματικά για όλες τις σκληρές ομαδοποιήσεις. Αυτά τα μέτρα δεν λαμβάνουν υπόψη τους τις συμμετοχές που βασίζονται σε πιθανότητες. Ως επέκταση του ARI, η παρούσα διατριβή εισάγει μια εκδοχή του ARI, το Soft Adjusted Rand Index (sARI) για τη διαχείριση των soft partitions. Εξετάζονται και συγκρίνονται τρεις εκδόσεις του sARI με τη χρήση κατασκευασμένων συνόλων δεδομένων που παρουσιάζουν πολλαπλά σχήματα συστάδων και ποσά επικάλυψης. Με βάση τα ευρήματά μας, ο τύπος 1 του sARI φαίνεται να ταιριάζει περισσότερο με τον ARI, ενώ παράλληλα αλλάζει σε πλήρη αβεβαιότητα ομαδοποίησης soft. Αυτή η εργασία δίνει ιδέες για το πώς να βελτιωθούν οι μέθοδοι επικύρωσης της συσταδοποίησης για πιθανοτικά μοντέλα.el
dc.description.abstractEvaluating clustering quality is undeniably important for unsupervised learning, especially when thoroughly managing soft clustering methods. The Adjusted Rand Index (ARI) and additional customary measures are effective for all hard clustering. These measures do not account for any probabilistic memberships. As an extension of ARI, this thesis introduces one version of the Soft Adjusted Rand Index (sARI) to handle soft partitions. Three versions of sARI are examined and compared with the use of constructed datasets showing multiple cluster shapes and overlap amounts. Based on our findings, sARI Type 1 seems to align fully with ARI, all the while changing to complete soft clustering uncertainty. This work gives ideas about how to improve clustering validation methods for probabilistic models.en
dc.embargo.ruleOpen access
dc.format.extentpages 55en
dc.identifier.urihttps://pyxida.aueb.gr/handle/123456789/11924
dc.languageen
dc.rightsAttribution 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectSoft clusteringen
dc.subjectAdjusted Rand indexen
dc.subjectSoft adjusted Rand indexen
dc.subjectGaussian mixture modelsen
dc.subjectClustering evaluationen
dc.subjectΜαλακή ομαδοποίησηel
dc.subjectΠροσαρμοσμένος δείκτης Randel
dc.subjectΜαλακός προσαρμοσμένος δείκτης Randel
dc.subjectΜικτά μοντέλα Gaussianel
dc.subjectΑξιολόγηση ομαδοποίησηςel
dc.titleAdjusted rand index in soft clusteringen
dc.title.alternativeΠροσαρμοσμένος δείκτης ραντ σε μαλακή ομαδοποίησηel
dc.typeText

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Kalatzis_2025.pdf
Μέγεθος:
2.75 MB
Μορφότυπο:
Adobe Portable Document Format