Model misspecification in semi-parametric survival models
Ημερομηνία
2025-10-24
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Επιβλέποντα
Διαθέσιμο από
Περίληψη
Survival analyses in medical research often relies on the Cox proportional hazards (PH) model and related parametric approaches, yet routine violations of modeling assumptions can distort inference. This thesis investigates the consequences of model misspecification for both semi-parametric and parametric survival regression, using simulation. Time-to-event data are generated under prespecified data-generating mechanisms (DGMs), namely, Exponential, Weibull, and Logistic, as well as mixtures that induce both proportional and nonproportional baseline hazards. Then, commonly used models were fitted, and a spectrum of misspecifications was also examined, including omitted covariates and violations of the PH assumption. Two motivating case studies in radiation oncology use patient-level data to illustrate how misspecification appears in practice and how it biases variable effect estimates. The findings highlight that while the Cox model shows relative robustness in some scenarios, substantial bias and assumption violations occur in heterogeneous or mixed populations. Collectively, the results provide practical guidance for model selection and sensitivity analysis in time-to-event studies, emphasizing simulation as a principled means to probe and mitigate misspecification.Η ανάλυση επιβίωσης αποτελεί ένα θεμελιώδες εργαλείο στην ιατρική έρευνα και συχνά βασίζεται στο ημιπαραμετρικό μοντέλο αναλογικών κινδύνων του Cox (Cox PH model) καθώς και σε συναφείς παραμετρικές μεθόδους. Ωστόσο, οι παραβιάσεις των υποθέσεων αυτών είναι συχνές και μπορούν να οδηγήσουν σε μεροληπτικά ή παραπλανητικά συμπεράσματα.
Η παρούσα διπλωματική εργασία διερευνά τις συνέπειες της εσφαλμένης προδιαγραφής μοντέλου (model misspecification) στα ημιπαραμετρικά και παραμετρικά μοντέλα επιβίωσης, μέσω προσομοιώσεων Monte Carlo. Οι χρόνοι επιβίωσης παράγονται βάσει προκαθορισμένων μηχανισμών δημιουργίας δεδομένων (Data-Generating Mechanisms, DGMs), που περιλαμβάνουν κατανομές όπως Exponential, Weibull και Logistic, καθώς και μεικτά σενάρια που οδηγούν σε αναλογικούς και μη αναλογικούς ρυθμούς κινδύνου. Στη συνέχεια, εφαρμόζονται τα πλέον διαδεδομένα μοντέλα, ενώ εξετάζεται ένα εύρος μορφών εσφαλμένης προδιαγραφής, όπως η παράλειψη μεταβλητών και η παραβίαση της υπόθεσης των αναλογικών κινδύνων. Δύο σύνολα πραγματικών δεδομένων από μελέτες στον χώρο της ακτινοθεραπείας χρησιμοποιούνται ως παραδείγματα, προκειμένου να αναδειχθεί πώς εκδηλώνεται στην πράξη η εσφαλμένη προδιαγραφή και πώς επηρεάζει τις εκτιμήσεις των επιδράσεων των μεταβλητών. Τα ευρήματα αποδεικνύουν ότι, αν και το μοντέλο του Cox παρουσιάζει σχετική ανθεκτικότητα σε ορισμένα σενάρια, σημαντική μεροληψία και παραβιάσεις των υποθέσεων παρατηρούνται σε ετερογενείς ή μεικτούς πληθυσμούς. Συνολικά, τα αποτελέσματα προσφέρουν πρακτικές κατευθύνσεις για την επιλογή του κατάλληλου μοντέλου και τη διενέργεια αναλύσεων ευαισθησίας σε μελέτες επιβίωσης, υπογραμμίζοντας τον ρόλο της προσομοίωσης ως θεμελιώδους μεθόδου για τη διερεύνηση και τον περιορισμό των επιπτώσεων της εσφαλμένης προδιαγραφής.
Περιγραφή
Λέξεις-κλειδιά
Model misspecification, Semi-parametric survival models, Monte Carlo simulation, Proportional hazards assumption, Cox proportional hazards model, Ανάλυση επιβίωσης, Ημιπαραμετρικά μοντέλα επιβίωσης, Παραβίαση αναλογικών κινδύνων, Εσφαλμένη προδιαγραφή μοντέλου

