Abstract : | Πρωταρχικός σκοπός αυτής της εργασίας είναι να αποκτήσουμε γνώσεις πιθανολογικής προσέγγισης κατά Μπεϋς στη στατιστική ανάλυση και σύγκριση μοντέλων για μια πολύ επιστημονική και πρακτική κατανόηση και χειρισμό της ανάλυσης στατιστικών δεδομένων. Με αυτή τη διατριβή διερευνάμε το Μπεϋζιανό πλαίσιο στη στατιστική ανάλυση για τη σύγκριση μοντέλων, εφαρμόζουμε την επιλογή μεταβλητών, τις εκ των προτέρων κατανομές και τους ελέγχους υποθέσεων σε πίνακες συνάφειας χρησιμοποιώντας την Ρ και την Σταν που είναι μια προστακτική γλώσσα προγραμματισμού για Μπεϋζιανη Στατιστική χρησιμοποιώντας την εξελιγμένη στη μέθοδο MCMC βασισμένη στη κλίση. Στο πρώτο κεφάλαιο εισάγουμε στον αναγνώστη στη Μπεϋζιανη μεθοδολογία και τη διαδικασία του υπολογισμού του παράγοντα Μπεϋς, λαμβάνοντας υπόψη την ιστορική έρευνα που έχει γίνει και παρουσιάζουμε παραδείγματα που παράγονται χρησιμοποιώντας τη Σταν στην R. Στο δεύτερο κεφάλαιο παρουσιάζουμε τη δομή πιθανοτήτων στους πίνακες συνάφειας, η δειγματοληψία κατανομής (σχεδιασμός) αυτών και ο τρόπος με τον οποίο εφαρμόζουμε τον έλεγχο ανεξαρτησίας και μερικές από τις σημαντικότερες στατιστικές μετρήσεις όπως ο λόγος συμπληρωματικής πιθανότητας, ο λόγος κινδύνου και οι διαφορές ποσοστών χρησιμοποιώντας συζυγείς εκ των προτέρων κατανομές .Στο τρίτο κεφάλαιο, εμβαθύνουμε στο κόσμο των Γενικευμένων Γραμμικών Μοντέλων, μέσω της σύζυγης ανάλυσης των εκ των προτέρων κατανομών και παρουσιάζουμε την λογιστική παλινδρόμηση, τα μοντέλα λογαριθμογραμμικά μοντέλα, τα πολυωνυμικά και τα διατάξιμα μοντέλα. Στο κεφάλαιο 4 παρουσιάζουμε στον αναγνώστη τα κριτήρια πιθανοφάνειας-ποινής για την σύγκριση μοντέλων. Τα ΑΙΚ, ΜΠΙΚ και ΝΤΙΚ αποτελούν τα βασικά κριτήρια ενδιαφέροντος μαζί με το κριτήριο διασταυρούμενης επικύρωσης , το οποίο δημιουργήθηκε ως διαδικασία σύγκρισης μοντέλων, εξετάζοντας την προβλεπτική ακρίβεια των μοντέλων που παράγονται στη Σταν. Επιπλέον, στο κεφάλαιο 5 εξετάζουμε τις εξαρτημένες παρατηρήσεις και τα μοντέλα αντιστοιχούμενων ζευγών. Τα μοντέλα συμμετρίας, περιθώριας ομογένειας ,ο συντελεστής κάππα του Κοέν και ο έλεγχος Μακ-Νιμαρ είναι μερικά από τα μοντέλα που απασχολούν τους επιστήμονες σε πολλούς επιστημονικούς τομείς και στο παρόν κεφάλαιο παρουσιάζουμε την πιθανολογική προσέγγιση αυτών με την Μπεϋζιανή στατιστική. Primary goal of this thesis is to gain the knowledge of probabilistic perspective in statistical analysis and model comparison for a much scientific and practical understanding and handling of statistical data analysis. With this thesis we explore the Bayesian framework in Statistics for model comparison, we implement variable selection, prior distribution specification and hypothesis testing in contingency tables using R and Stan which is an imperative modelling programming language for Bayesian Statistics using the sophisticated gradient-based MCMC method. In the first chapter we introduce to the reader the Bayesian methodology and the process of Bayes Factor calculation given the historically research that has been done and we present examples produced using Stan in R. In the second chapter we present the probability structure in contingency tables, the distributional sampling (de- sign) of them and how we implement independence test and some of the most important statistical measurements like odds ratio, risk ratio and difference in proportions using conjugate priors.In the third chapter we dive in the Generalized Linear Models world, through the conjugate prior analysis of logistic regression, log-linear models, multinomial and ordinal models.In chapter 4, we introduce to the reader the idea of penalized likelihood for model comparison. AIC,BIC and DIC are the main criteria of interest along with the Leave-One-Out cross validation criterion, that has been created as a model comparison process, examining the expected predictive accuracy of the models produced in Stan. In addition in chapter 5 we examining the dependent observations for Matched Pair models. Symmetry, marginal homogeneity, Kappa coefficient, McNemar test are subjects that are concerning scientists in many fields of science and in this chapter we present the probabilistic approach of them with Bayesian analysis.
|
---|