Abstract : | H ανάλυση παραγόντων είναι μια πολυμεταβλητή στατιστική τεχνική που χρησιμοποιείται κυρίως για να χαρακτηρίσει τη δομή εξάρτησης των παρατηρούμενων συσχετιζόμενων μεταβλητών χρησιμοποιώντας μη παρατηρούμενες μεταβλητές γνωστές ως παράγοντες, ενώ ταυτόχρονα παρέχει μείωση των διαστάσεων. Σκοπός της παρούσας διατριβής είναι να περιγράψει το μοντέλο της παραγοντικής ανάλυσης καθώς και τις υποθέσεις και τα χαρακτηριστικά του. Επιπλέον, εξηγεί το ζήτημα της ταυτοποίησης των παραμέτρων ενός Μπεϋζιανού (Bayes) μοντέλου ανάλυσης παραγόντων, συγκεκριμένα, το πρόβλημα της μοναδικότητας του πίνακα διακυμάνσεων συνδιακυμανσεων των ιδιότυπων σφαλμάτων και το πρόβλημα ταυτοποίησης που αφορά τον πίνακα φορτώσεων παραγόντων. Επιπρόσθετα, περιγράφονται ορισμένες γνωστές Μπεϋζιανές μέθοδοι για προσομοίωση δειγμάτων από την εκ των υστέρων κατανομή που αφορούν τις παραμέτρους ενδιαφέροντος του μοντέλου ανάλυσης παραγόντων, καθώς και ορισμένες Μπεϋζιανές μέθοδοι που επιλύουν τα ζητήματα ταυτοποίησης των παραμέτρων ενός Μπεϋζιανού μοντέλου ανάλυσης παραγόντων. Επιπλέον, η αποτελεσματικότητα των μεθόδων αυτών αξιολογείται σε συνθετικά και σε δύο πραγματικά σύνολα δεδομένων. Συγκεκριμένα, τα δύο πραγματικά σύνολα δεδομένων αποτελούνται από το ερωτηματολόγιο Humor Style Questionnaire που βασίζεται στο μοντέλο χιούμορ των R. A. Martin et al. (2003) και το Big Five Personality Τest, ένα από τα πιο γνωστά σύνολα δεδομένων στον τομέα της ψυχολογίας. Factor Analysis is a multivariate statistical technique mainly used to characterize the dependence structure of observed correlated variables using unobserved variables known as factors while at the same time providing dimensionality reduction. The purpose of this thesis is to describe the factor analysis model as well as its assumptions and its characteristics. Moreover, it explains the identification issue of the parameters of the Bayesian factor analysis model, namely the uniqueness problem of the variance covariance matrix of the idiosyncratic errors and the identification issue regarding the factor loadings matrix originated by orthogonal ambiguities and label switching. Furthermore, some well-known Bayesian methods for the production of posterior samples for the parameters of interest of the factor analysis model are described as well as some Bayesian methods solving the identification issues of the parameters of a Bayesian factor analysis model. Additionally, the efficiency of these methods will be evaluated in synthetic data sets and two real data sets. In particular, the two real data sets consists of the Humor Style Questionnaire based on the humor model of R. A. Martin, Puhlik-Doris, Larsen, Gray, and Weir (2003) and the Big Five Personality test, one of the most well-known data sets in the field of psychology.
|
---|