Computational approaches for Bayesian inference in copula based hierarchical models: an application to anti-doping
Ημερομηνία
2026-02-11
Συγγραφείς
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Επιβλέπων / ουσα
Διαθέσιμο από
Περίληψη
Anti-doping organizations invest a lot on doping control in order to protect sport competitions. On 2009, the Athlete Biological Passport (ABP) complemented this mission worldwide as it is used to monitor athlete’s individual profiles over time. It is implemented through a Bayesian framework, called ADAPTIVE, which determines individual reference ranges beyond which a measurement may signal potential doping. Doping detection increasingly relies on longitudinal biomarker monitoring, yet most current statistical tools analyze biomarkers marginally and ignore their dependence structure. This creates a methodological gap, as doping often alters multivariate patterns rather than individual values. Copula models provide a principled way to separate marginal behavior from joint dependence, making them well suited for detecting multivariate deviations. This thesis aims to develop and evaluate a Bayesian copula-mixture framework for modelling longitudinal hematological biomarkers within the context of the Athlete Biological Passport. The central research question is how different Bayesian estimation strategies affect the recovery of marginal parameters and dependence structure. The proposed methodology, full MCMC, combined flexible mixture models for marginal distributions with a survival Clayton copula to capture upper-tail dependence, a feature particularly relevant for detecting coordinated biomarker elevations. Two estimation strategies are implemented and compared, a Bayesian-IFM scheme and a full Bayesian MCMC algorithm, and extensive simulation studies are con ducted to assess identifiability, bias, RMSE, posterior uncertainty and and predictive performance under each approach. Results show that the full MCMC method improves the recovery of the copula parameter and better captures tail dependence, while the joint sampling approach offers greater numerical stability and more precise marginal estimates. The comparison highlights clear trade-offs between computational efficiency, dependence estimation accuracy and uncertainty quantification, providing practical guidance for Bayesian dependence modeling in anti-doping applications.Οι οργανισμοί αντι-ντόπινγκ επενδύουν σημαντικούς πόρους στον έλεγχο ντόπινγκ με σκοπό την προστασία της ακεραιότητας των αθλητικών διοργανώσεων. Το 2009 θεσπίστηκε το Βιολογικό Διαβατήριο Αθλητή (Athlete Biological Passport) για να ενισχύσει αυτή την αποστολή σε παγκόσμιο επίπεδο, με τον μηχανισμό αυτό μπορούμε να παρακολουθήσουμε μέσα στο χρόνο τα ατομικά προφίλ βιομετρικών-δεικτών των αθλητών. Η πρακτική εφαρμογή του βασίζεται σε ένα Μπεϋζιανό πλαίσιο, το ADAP TIVE, το οποίο έχει σχεδιαστεί για να προσδιορίζει ατομικά εύρη τιμών, εκτός των οποίων η παρουσία μιας παρατήρησης μπορεί να υποδηλώνει χρήση απαγορευμένων ουσιών. Η ανίχνευση του ντόπινγκ (χρήσης απαγορευμένων ουσιών από τους αθλητές) βασίζεται ολοένα και περισσότερο στη συστηματική σε βάθος χρόνου παρακολούθηση βιοδεικτών, ωστόσο τα περισσότερα στατιστικά εργαλεία που χρησιμοποιούνται για αυτό το σκοπό σήμερα αναλύουν τους βιοδείκτες μεμονωμένα και αγνοούν τη δομή εξάρτησης τους. Αυτό δημιουργεί ένα μεθοδολογικό κενό, καθώς η χρήση ντόπινγκ συχνά μεταβάλλει πολυμεταβλητά πρότυπα-μοτίβα και όχι μεμονωμένες τιμές. Τα μοντέλα copula προσφέρουν ένα πλαίσιο κανόνων για τον διαχωρισμό της περιθώριας συμπεριφοράς (κατανομής) από την από κοινού εξάρτηση, καθιστώντας τα κατάλληλα για την ανίχνευση πολυμεταβλητών μεταβολών. Η παρούσα εργασία στοχεύει στην ανάπτυξη και αξιολόγηση ενός Μπεϋζιανού copula-mixture πλαισίου για τη μοντελοποίηση βιοδεικτών διαχρονικά στο πλαίσιο του Βιολογικού Διαβατηρίου Αθλητή. Το κεντρικό ερευνητικό ερώτημα αφορά το πώς διαφορετικές Μπεϋζιανές στρατηγικές εκτίμησης επηρεάζουν την ανάκτηση των οριακών παραμέτρων της δομής εξάρτησης τους και της απόδοσης της πρόβλεψης. Η προτεινόμενη μεθοδολογία συνδυάζει ευέλικτα μοντέλα μίξης για τις οριακές κατανομές, με μια survival Clayton copula για την αποτύπωση της εξάρτησης στο άνω άκρο, χαρακτηριστικό που χρησιμεύει άμεσα στην ανίχνευση ταυτόχρονων μεταβολών τιμών βιοδεικτών. Υλοποιούνται και συγκρίνονται δύο στρατηγικές εκτίμησης: μια Μπεϋζιανή IFM-διαδικασία και ένας πλήρως Μπεϋζιανος MCMC αλγοριθμός. Εκτεταμένες προσωμοιώσεις πραγματοποιούνται για την αξιολόγηση της ταυτοποίησης, της μεροληψίας, του υπολογισμού της ρίζας μέσου τετραγωνικού σφάλματος, και της εκ των υστέρων αβεβαιότητας σε κάθε προσέγγιση. Τα αποτελέσματα δείχνουν ότι η πλήρης MCMC μέθοδος βελτιώνει την ανάκτηση της παραμέτρου της copula και αποτυπώνει καλύτερα την εξάρτηση στο άνω άκρο, ενώ η προσέγγιση της από κοινού δειγματοληψίας προσφέρει μεγαλύτερη αριθμητική σταθερότητα και ακριβέστερες εκτιμήσεις των οριακών παραμέτρων. Η σύγκριση αναδεικνύει σαφείς συμβιβασμούς μεταξύ υπολογιστικής αποδοτικότητας, ακρίβειας εκτίμησης της εξάρτησης και ποσοτικοποίησης της αβεβαιότητας, παρέχοντας πρακτική καθοδήγηση για Μπεϋζιανή μοντελοποίηση της εξάρτησης σε εφαρμογές αντιτόπινγκ.
Περιγραφή
Λέξεις-κλειδιά
Copula models, Athlete biological passport, Metropolis-Hastings, Bayesian inference for margins, Κοπούλα μοντέλα, Βιολογικό διαβατήριο αθλητή, Μπεϋζιανή συμπερασματολογία για περιθώριες κατανομές

