PYXIDA Institutional Repository
and Digital Library
Collections :

Title :Cluster analysis of compositional data. Εφαρμογή συσταδοποίησης του καφέ με βάση πτητικές ενώσεις που εμφανίζονται στο άρωμα εμπορικών δειγμάτων του
Alternative Title :Cluster analysis of compositional data. An application to cluster coffee aroma based on chemical compositional data of commercial coffee brands
Creator :Παλλαντζά, Παρασκευή
Contributor :Παπαγεωργίου, Ιουλία (Επιβλέπων καθηγητής)
Ψαράκης, Στέλιος (Εξεταστής)
Παπασταμούλης, Παναγιώτης (Εξεταστής)
Οικονομικό Πανεπιστήμο Αθηνών, Τμήμα Στατιστικής (Degree granting institution)
Type :Text
Extent :83σ.
Language :el
Identifier :
Abstract :Σκοπός της παρούσας εργασίας αποτελεί η ανάδειξη της σημασίας των δεδομένων συστάσεων (compositional data -CODA) κατά τη διαδικασία ομαδοποίησης (cluster analysis), στην περίπτωση εκείνη που τα αρχικά δεδομένα μεταφέρουν σχετικές πληροφορίες.Αρχικά παρουσιάζονται βασικές έννοιες και μέθοδοι ομαδοποίησης δεδομένων στην στατιστική επιστήμη. Ακολουθεί ανάλυση των δεδομένων συστάσεων, της φύσης και των ιδιοτήτων τους, συνοδευόμενη από τις κυριότερες μεθόδους μετασχηματισμού των αρχικών δεδομένων σε compositional data (CODA) καθώς και του συνηθέστερα εμφανιζόμενου προβλήματος κατά τη χρήση τους, όπου παρατηρήσεις είτε δεν παρουσιάζουν τιμή είτε ισούνται με το μηδέν (missing values και zero values αντίστοιχα).Κατόπιν πραγματοποιείται ιεραρχική ομαδοποίηση (cluster hierarchical analysis) και ανάλυση κύριων συνιστωσών (principal component analysis) τόσο στα αρχικά δεδομένα, όσο και στα λογαριθμικά μετασχηματισμένα δεδομένα με βάση το κέντρο τους (centered log-ratio transformation - clr), με τη χρήση της γλώσσας προγραμματισμού R. Τέλος, ακολουθεί συγκριτική ανάλυση των αποτελεσμάτων των ανωτέρω μεθόδων ομαδοποίησης και εξαγωγή των σχετικών συμπερασμάτων, δηλαδή της σπουδαιότητας της χρήσης των δεδομένων συστάσεων (compositional data) κατά τη διαδικασία ομαδοποίησης δεδομένων, των οποίων η σχετική πληροφορία μεταφέρεται μέσω της συσχέτισής τους, δηλαδή των αναλογιών τους και όχι των επιμέρους τιμών τους.
The purpose of this thesis is to highlight the importance of compositional data (CODA) in the cluster analysis process, in the case where the original data conveys relevant information.To begin with, basic concepts and methods of data grouping in statistical science are presented. The following section is an analysis of the compositional data, their nature and properties, as well as the main methods of transforming the original data into CODA and the most common problem during their use, that of the missing values and zero values.Then hierarchical cluster analysis and PCA statistical analysis are performed on both the original data and the clr-transformed compositional data, with the use of the programming language R.Finally, a comparative analysis of the results of the above grouping methods follows and the relevant conclusions are drawn, namely the importance of using compositional data in the data grouping process, the relevant information of which is transferred through correlation. ie their proportions and not their individual values.
Subject :Ιεραρχική ομαδοποίηση
Ανάλυση κατά συστάδες
Δεδομένα συστάσεων
Λογαριθμικοί μετασχηματισμοί
Ανάλυση κύριων συνιστωσών
Hierarchical cluster analysis
Compositional data
Principal component analysis
Log-ratio transformations
Date Available :2021-09-28 14:22:43
Date Issued :09/23/2021
Date Submitted :2021-09-28 14:22:43
Access Rights :Free access
Licence :

File: Pallantza_2021.pdf

Type: application/pdf