Abstract : | Markov Chain Monte Carlo (MCMC) is a family of stochastic algorithms which are used to draw random samples from arbitrary probability distributions. This task is necessary to solve a variety of problems in Bayesian modelling, e.g. prediction and model comparison, making MCMC a fundamental tool in modern statistics. As model complexity increases, the performance of classical MCMC algorithms deteriorates due to their potentially limited exploration of the target distribution. The latest developments in statistics and machine learning suggest that Hamiltonian Monte Carlo (HMC) method can offer statistical and computational efficiency com-pared to MCMC. Hamiltonian Monte Carlo (HMC) is a state-of-the-art sampling algorithm for Bayesian computation. Popular probabilistic programming language Stan rely on HMC’s generality and efficiency to provide automatic Bayesian inference platforms for epidemic models and more. Our main purpose in this thesis is to provide a brief description of the most important features of Stan’s implementation of HMC in the context of epidemic models. We present the HMC algorithm as well as the advantages of the Stan platform and we introduce information criteria like AIC, WAIC and DIC, the most common methods for selecting statistical models. By applying the above techniques to simulated and real data, it is shown that Stan is a (perhaps the only) general purpose software which provides a built-in mechanism for specifying and solving systems of ordinary differential equations, thus facilitating inference in epidemic models. Οι μέθοδοι Μόντε Κάρλο είναι μια μεγάλη κατηγορία υπολογιστικών αλγορίθμων που στηρίζονται σε τυχαία δειγματοληψία με σκοπό την εξαγωγή αριθμητικών αποτελεσμάτων. Η χρήση του MCMC είναι απαραίτητη για την επίλυση ποικίλων προβλημάτων στα Μπεϋζιανά μοντέλα, π.χ. πρόβλεψη και σύγκριση μοντέλων, καθιστώντας το MCMC θεμελιώδες εργαλείο στις σύγχρονες στατιστικές. Καθώς η πολυπλοκότητα των μοντέλων αυξάνεται, οι επιδόσεις των κλασικών αλγορίθμων MCMC εξασθενούν λόγω της ενδεχομένως περιορισμένης εξερεύνησης της κατανομής στόχου. Οι μεγαλύτερες εξελίξεις στη στατιστική και στη μηχανική μάθηση υποδηλώνουν ότι η μέθοδος Hamiltonian Monte Carlo (HMC)μπορεί να προσφέρει στατιστική και υπολογιστική αποτελεσματικότητα σε σύγκριση με το MCMC. Το Hamiltonian MonteCarlo (HMC)είναι ένας υπερσύγχρονος αλγόριθμος δειγματοληψίας για την Μπευζιανή. Η δημοφιλής πιθανολογική γλώσσα προγραμματισμού Stan βασίζεται στη γενίκευση και την αποτελεσματικότητα του HMC για να παρέχει αυτόματες πλατφόρμες Μπευζιανών συμπερασμάτων για επιδημιολογικά μοντέλα και πολλά άλλα. Ο κύριος στόχος μας σε αυτή τη διπλωματική εργασία είναι να παρέχουμε μια σύντομη περιγραφή των πιο σημαντικών χαρακτηριστικών της εφαρμογής του HMC από το Stan στο πλαίσιο των επιδημικών μοντέλων. Παρουσιάζουμε τον αλγόριθμο HMC καθώς και τα πλεονεκτήματα της πλατφόρμας Stan και εισάγουμε κριτήρια πληροφόρησης όπως τα AIC, WAIC και DIC,τις πιο κοινές μεθόδους για την επιλογή στατιστικών μοντέλων. Με την εφαρμογή των παραπάνω τεχνικών σε προσομοιωμένα και πραγματικά δεδομένα, δείχνει ότι το Stan είναι ένα (ίσως το μόνο) λογισμικό γενικού σκοπού που παρέχει έναν ενσωματωμένο μηχανισμό για τον προσδιορισμό και την επίλυση συστημάτων συνήθων διαφορικών εξισώσεων, διευκολύνοντας έτσι τη συμπερίληψη σε επιδημικά μοντέλα.
|
---|