Περίληψη : | Η διατριβή αυτή έχει σκοπό να δείξει πως μπορούμε να βελτιώσουμε την αποδοτικότητα μίας μελέτης κλινικής δοκιμής. Αρχικά, εισάγουμε κάποιες βασικές έννοιες σχετικά με τo γενικότερο πλαίσιο μια τυπικής κλινικής δοκιμής. Έπειτα, παρουσιάζουμε μερικές τεχνικές που χρησιμοποιούνται με σκοπό την βελτίωση ενός εκτιμητή, όπως αυτές φαίνονται στην διεθνή βιβλιογραφία. Οι μέθοδοι αυτές βασίζονται κυρίως στην ημι-παραμετρική θεωρία (semiparametric theory). Στην συνέχεια της διατριβής, πρόκειται να αναλύσουμε δεδομένα τα οποία βασίζονται σε μια πραγματική κλινική δοκιμή (ACTG175 study), όπου χρησιμοποιώντας αυτές τις μεθόδους θα εξετάσουμε εάν υπάρχουν διαφορές μεταξύ των θεραπειών. Καταλήγοντας, θα διεξάγουμε μία ανάλυση προσομοίωσης, με σκοπό να εξετάσουμε την απόδοση και συμπεριφορά των διαφόρων τεχνικών, καθώς επίσης και να απαντήσουμε στο ερώτημα του εάν υπάρχει βελτίωση στην αποδοτικότητα, την οποία θα πρέπει να λάβουμε υπόψιν. Οι τεχνικές βελτίωσης των εκτιμητών, τις οποίες πρόκειται να παρουσιάσουμε διαφέρουν ως προς την πολυπλοκότητά τους, από τα απλά γραμμικά μοντέλα, σε μη παραμετρικούς αλγορίθμους μηχανικής μάθησης όπως ο Random Forest. Τέλος, θα δείξουμε και μια μέθοδο ensemble, η οποία συνδυάζει πολλές από τις παραπάνω μεθόδους και βασίζεται στη βιβλιοθήκη SuperLearner της R γλώσσας προγραμματισμού. This dissertation thesis is about understanding how to improve the efficiency of a clinical trial study, by performing various estimator augmentation techniques. At first, a few basic notions are discussed regarding the setup and the framework of a typical clinical trial study. Afterwards, we exhibit a few different estimator augmentation techniques, as they appear in the international bibliography. These methods are primarily based on a semiparametric theory. Later in our thesis, we perform an analysis on a real-world example (ACTG175 study), using these various methods, in order to examine whether there is a difference in the means between the different treatment groups. Concluding, we perform a simulation analysis, to examine the performance of the methods, as well as to answer whether the increase in efficiency is valid, and should we consider it. The augmentation techniques which we are going to present vary between complexity from a simple linear model, to non-parametric machine learning algorithms like Random Forest, and finally we showcase an ensemble method which combines many of the other algorithms, which is based οn the SuperLearner library of the R Programming Language.
|
---|