PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :A modelling approach for correlated binary outcomes
Alternative Title :Μια προσέγγιση μοντελοποίησης συσχετισμένων δυαδικών δεδομένων
Creator :Αθανασοπούλου, Ιωάννα
Athanasopoulou, Ioanna
Contributor :Βασδέκης, Βασίλειος (Επιβλέπων καθηγητής)
Δελλαπόρτας, Πέτρος (Εξεταστής)
Καρλής, Δημήτριος (Εξεταστής)
Τσιαμυρτζής, Παναγιώτης (Εξεταστής)
Πεντελή, Ξανθή (Εξεταστής)
Μουστάκη, Ειρήνη (Εξεταστής)
Βιτωράτου, Σίλια (Εξεταστής)
Athens University of Economics and Business, Department of Statistics (Degree granting institution)
Type :Text
Extent :454p.
Language :en
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=7848
Abstract :Σκοπός της παρούσης διατριβής είναι η συμβολή στην μοντελοποίηση της δομής συσχέτισης μεταξύ δυαδικών δεδομένων κοινής ομάδας. Το μοντέλο που αναπτύχθηκε βασίζεται σε μια αναπαράσταση της από κοινού πιθανότητας όπου η συσχέτιση των παρατηρήσεων κάθε ομάδας έχει ενσωματωθεί ως συνάρτηση μιας παραμέτρου και των περιθωριακών πιθανοτήτων των μελών της ομάδας, με το επιστημονικό ενδιαφέρον να επικεντρώνεται στην παράμετρο συσχετισμού καθώς και στους συντελεστές της παλινδρόμησης που αντιστοιχούν στις περιθωριακές πιθανότητες των δυαδικών παρατηρήσεων. Μια κατασκευαστική τεχνική που έχει προταθεί από τους Oman και Zucker χρησιμοποιείται ώστε να οριστούν δυαδικές μεταβλητές με δεδομένες περιθωριακές πιθανότητες και με απλές παραμετρικές δομές για τη συσχέτιση μεταξύ των ζευγών των παρατηρήσεων, οι οποίες προκύπτουν από τις κοινές πιθανότητες των μεταβλητών. Συγκεκριμένα, η παράμετρος που συνδέεται με τη συσχέτιση εκφράζει τη σχετική θέση της από κοινού πιθανότητας ζεύγους παρατηρήσεων μεταξύ της ανεξαρτησίας και της μέγιστης συσχέτισης. Επιπλέον, είναι μια μέθοδος κοινής πιθανοφάνειας που χρησιμοποιεί την αναπαράσταση του Bahadur, η οποία βασίζεται στην αποσύνθεση της από κοινού κατανομής στην κατανομή υπό ανεξαρτησία και σε ένα διορθωτικό παράγοντα που ενσωματώνει τη συσχέτιση εντός των ομάδων. Στο τρέχον πρότυπο θα χρησιμοποιηθεί η προσέγγιση 2ης τάξης, όπου υιοθετείται η υπόθεση των μηδενικών συσχετίσεων τάξης μεγαλύτερης του δύο. Για την εκτίμηση των παραμέτρων του μοντέλου χρησιμοποιούνται Μπεϋζιανές μέθοδοι εκτίμησης MCMC, λόγω δυσκολίας προσέγγισης μέσω αναλυτικών μεθόδων εκτίμησης.Εξετάζονται διάφορα σχήματα μοντελοποίησης της παραμέτρου συσχέτισης με τα πιο αποτελεσματικά από αυτά να είναι το απλό μοντέλο όπου όλες οι ομάδες έχουν κοινή παράμετρο συσχέτισης και το μοντέλο που η παράμετρος συσχέτισης μοντελοποιείται ως συνάρτηση ενός γραμμικού συνδυασμού ανεξάρτητων μεταβλητών. Περαιτέρω μοντέλα έχουν εξεταστεί όπου οι περιθωριακές πιθανότητες επηρεάζονται μέσω τυχαίων επιδράσεων παρατηρήσεως ή ομάδας, ή η παράμετρος συσχετισμού επηρεάζεται από τυχαία επίδραση της ομάδας, αλλά προέκυψαν ζητήματα σύγκλισης. Η απόδοση των μοντέλων εξετάστηκε σε προσομοιωμένα και πραγματικά σύνολα δεδομένων.
The scope of this Thesis is to contribute in the area of modelling the correlation structure of clustered binary data. The model developed is based on a joint likelihood representation where within cluster correlation has been incorporated as a function of a cluster specific parameter and the cluster's marginal probabilities, with the parameters of interest being the correlation parameter together with the regression coefficients corresponding to marginal expectations of the binary responses.A constructive technique, proposed by Oman and Zucker, is used in order to define binary variables with given marginal probabilities and some simple parametric pairwise correlation structures derived from the variables' joint probabilities. In particular, the parameter related to the correlation expresses the relative position of pairwise joint probability between the independent case and the one of maximum correlation. In addition the modelling approach is a joint likelihood method using the Bahadur's representation which is based on the decomposition of joint distribution into the joint distribution under independence, and a correction factor that incorporates within cluster correlation. In the current approach the 2-order approximation of joint distribution will be used, assuming correlations higher than pairwise to be equal to 0. For the estimation of model’s parameters, Marcov Chain Monte Carlo Bayesian methods are used due to being difficult to be analytically tractable.Various modelling schemas of the correlation parameter are examined with the most efficient ones being the simple model with a common correlation parameter for all clusters and the model where the cluster correlation parameter is modelled as a function of a linear combination of covariates. Further models have been examined where marginal probabilities are modelled through observation or cluster random effects, or correlation parameter has a cluster specific random effect, but convergence issues were confronted. The models' performance is examined in simulated and real datasets.
Subject :Δυαδικά δεδομένα
Συσχέτιση
Μοντελοποίηση
Binary data
Correlation
Modelling
Date :16-09-2019
Date Available :2020-05-22 14:20:35
Date Submitted :2020-05-22 14:20:35
Access Rights :Free access
Licence :

File: Athanasopoulou_2019.pdf

Type: application/pdf