ΠΥΞΙΔΑ Ιδρυματικό Αποθετήριο
και Ψηφιακή Βιβλιοθήκη
Συλλογές :

Τίτλος :Cluster analysis of compositional data. Εφαρμογή συσταδοποίησης του καφέ με βάση πτητικές ενώσεις που εμφανίζονται στο άρωμα εμπορικών δειγμάτων του
Εναλλακτικός τίτλος :Cluster analysis of compositional data. An application to cluster coffee aroma based on chemical compositional data of commercial coffee brands
Δημιουργός :Παλλαντζά, Παρασκευή
Συντελεστής :Παπαγεωργίου, Ιουλία (Επιβλέπων καθηγητής)
Ψαράκης, Στέλιος (Εξεταστής)
Παπασταμούλης, Παναγιώτης (Εξεταστής)
Οικονομικό Πανεπιστήμο Αθηνών, Τμήμα Στατιστικής (Degree granting institution)
Τύπος :Text
Φυσική περιγραφή :83σ.
Γλώσσα :el
Αναγνωριστικό :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=8761
Περίληψη :Σκοπός της παρούσας εργασίας αποτελεί η ανάδειξη της σημασίας των δεδομένων συστάσεων (compositional data -CODA) κατά τη διαδικασία ομαδοποίησης (cluster analysis), στην περίπτωση εκείνη που τα αρχικά δεδομένα μεταφέρουν σχετικές πληροφορίες.Αρχικά παρουσιάζονται βασικές έννοιες και μέθοδοι ομαδοποίησης δεδομένων στην στατιστική επιστήμη. Ακολουθεί ανάλυση των δεδομένων συστάσεων, της φύσης και των ιδιοτήτων τους, συνοδευόμενη από τις κυριότερες μεθόδους μετασχηματισμού των αρχικών δεδομένων σε compositional data (CODA) καθώς και του συνηθέστερα εμφανιζόμενου προβλήματος κατά τη χρήση τους, όπου παρατηρήσεις είτε δεν παρουσιάζουν τιμή είτε ισούνται με το μηδέν (missing values και zero values αντίστοιχα).Κατόπιν πραγματοποιείται ιεραρχική ομαδοποίηση (cluster hierarchical analysis) και ανάλυση κύριων συνιστωσών (principal component analysis) τόσο στα αρχικά δεδομένα, όσο και στα λογαριθμικά μετασχηματισμένα δεδομένα με βάση το κέντρο τους (centered log-ratio transformation - clr), με τη χρήση της γλώσσας προγραμματισμού R. Τέλος, ακολουθεί συγκριτική ανάλυση των αποτελεσμάτων των ανωτέρω μεθόδων ομαδοποίησης και εξαγωγή των σχετικών συμπερασμάτων, δηλαδή της σπουδαιότητας της χρήσης των δεδομένων συστάσεων (compositional data) κατά τη διαδικασία ομαδοποίησης δεδομένων, των οποίων η σχετική πληροφορία μεταφέρεται μέσω της συσχέτισής τους, δηλαδή των αναλογιών τους και όχι των επιμέρους τιμών τους.
The purpose of this thesis is to highlight the importance of compositional data (CODA) in the cluster analysis process, in the case where the original data conveys relevant information.To begin with, basic concepts and methods of data grouping in statistical science are presented. The following section is an analysis of the compositional data, their nature and properties, as well as the main methods of transforming the original data into CODA and the most common problem during their use, that of the missing values and zero values.Then hierarchical cluster analysis and PCA statistical analysis are performed on both the original data and the clr-transformed compositional data, with the use of the programming language R.Finally, a comparative analysis of the results of the above grouping methods follows and the relevant conclusions are drawn, namely the importance of using compositional data in the data grouping process, the relevant information of which is transferred through correlation. ie their proportions and not their individual values.
Λέξη κλειδί :Ιεραρχική ομαδοποίηση
Ανάλυση κατά συστάδες
Δεδομένα συστάσεων
Λογαριθμικοί μετασχηματισμοί
Ανάλυση κύριων συνιστωσών
Hierarchical cluster analysis
Compositional data
Principal component analysis
Log-ratio transformations
Clustering
Διαθέσιμο από :2021-09-28 14:22:43
Ημερομηνία έκδοσης :09/23/2021
Ημερομηνία κατάθεσης :2021-09-28 14:22:43
Δικαιώματα χρήσης :Free access
Άδεια χρήσης :

Αρχείο: Pallantza_2021.pdf

Τύπος: application/pdf