PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :Fast Bayesian variable selection methods for high dimensional data with applications in neuroimaging data
Alternative Title :Μπεϋζιανές μέθοδοι επιλογής μεταβλητών για δεδομένα μεγάλης διάστασης με εφαρμογές σε νευροαπεικονιστικά δεδομένα
Creator :Καλογήρου, Αθανασία
Kalogirou, Athanasia
Contributor :Ntzoufras, Ioannis (Επιβλέπων καθηγητής)
Kornak, John (Εξεταστής)
Tsiamyrtzis, Panagiotis (Εξεταστής)
Athens University of Economics and Business, Department of Statistics (Degree granting institution)
Type :Text
Extent :153p.
Language :en
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11511
Abstract :Ένας ανοιχτός τομέας μεθοδολογικής έρευνας είναι η εξαγωγή γνώσης για σύνολα δεδομένων μεγάλης διάστασης. Στόχος της παρούσας διατριβής είναι η διερεύνηση διαφορετικών Μπευζιανών μεθόδων επιλογής μεταβλητών και η αξιολόγηση της απόδοσής τους σε περιβάλλοντα υψηλών διαστάσεων. Έμφαση δόθηκε στις μεθόδους «spike-and-slab» prior, οι οποίες συγκρίθηκαν με κλασικές στατιστικές μεθόδους επιλογής μεταβλητών, όπως η μέθοδος least absolute shrinkage and selection operator - LASSO. Τα κύρια ευρήματα καταλήγουν στο συμπέρασμα ότι οι μέθοδοι με spike-and-slab priors παραμένουν πολλά υποσχόμενες . Η μέθοδος επιλογής μεταβλητών Gibbs, η οποία είχε την καλύτερη απόδοση σε ένα σύνολο δεδομένων παραδείγματος, χρησιμοποιήθηκε επίσης στο σύνολο δεδομένων νευροαπεικόνισης με εικόνες μαγνητικής τομογραφίας εγκεφάλων ατόμων με άνοια. Η άνοια είναι ένα ανίατο σύνδρομο με μεγάλη ετερογένεια που επηρεάζεται από παράγοντες όπως ο τύπος της άνοιας, η γενική υγεία του ατόμου, καθώς και οι περιοχές του εγκεφάλου που επηρεάζονται περισσότερο. Ακόμη και εντός του ίδιου τύπου άνοιας, υπάρχει δια-ατομική μεταβλητότητα στον ρυθμό εξέλιξης της νόσου και στα συμπτώματα. Η κατανόηση αυτής της ετερογένειας είναι ζωτικής σημασίας για την ακριβή διάγνωση και την πρόβλεψη της πορείας της νόσου. Ειδικότερα, καθώς εμφανίζονται νέες θεραπείες και πολλές ακόμη βρίσκονται υπό ανάπτυξη, η πρόβλεψη της εξέλιξης της γνωστικής λειτουργίας θα αποτελέσει ανεκτίμητο εργαλείο για βελτιστοποίηση της επιλογής ασθενών σε κλινικές δοκιμές και για τον σχεδιασμό εξατομικευμένων στρατηγικών θεραπείας. Στην έρευνά μας, χρησιμοποιήσαμε δεδομένα δομικών μέτρων απεικόνισης του εγκεφάλου (ογκομετρικά δεδομένα) από ασθενείς με διάφορες μορφές μετωποκροταφικής άνοιας ( ALLFTD study) και διερευνήσαμε μια σειρά διαφορετικών μεθόδων για την επιλογή μεταβλητών για την πρόβλεψη της του επιπέδου της γνωστικής τους λειτουργίας. Διερευνήσαμε Μπεϋζιανές μεθόδους και συγκρίναμε τα προτεινόμενα μοντέλα μεταξύ τους. Τα μοντέλα που θεωρήθηκαν πιο υποσχόμενα συνδύαζαν καλή προβλεπτική ικανότητα με κλινική ερμηνευσιμότητα. Η κλινική ερμηνευσιμότητα είναι απαραίτητη για να πεισθεί η κλινική κοινότητα για την αξία των προτεινόμενων μεθόδων επιλογής μεταβλητών.
An open area for methodological research has been the knowledge extraction for high-dimensional datasets. The goal of this thesis is to explore different Bayesian Variable Selection methods and evaluate their performance in high dimensional settings. Emphasis was given in "spike-and-slab" prior methods, which was compared to classical statistical variable selection methods such as the least absolute shrinkage and selection operator (LASSO) method. The main findings conclude that BVS with spike-and-slab priors remain a promising alternative, as it leads to parsimonious models and allows for probabilistic inference. The Gibbs Variable Selection Method which had the best performance in a toy example data set was also used in the Neuroimaging data set with brain MRI images of people with dementia. Dementia is a devastating form of disease with high heterogeneity in symptoms which is further influenced by factors such as the type of dementia, an individual's overall health, as well as the brain regions most affected. Even within the same type of dementia, there is inter-individual variability in the rate of disease progression and symptoms. Understanding this heterogeneity associated with dementia is crucial for accurate diagnosis and disease course prediction. In particular, as potential treatments are appearing on the market and many more are in development, predicting progression of cognitive impairment will be an invaluable tool for optimizing patient selection in clinical trials and for planning personalized treatment strategies. In our research, we used brain imaging structural measures data (regional brain volumes) from patients with various forms of frontotemporal dementia (the ALLFTD study) and explored a range of different methods to select variables for predicting their level of cognitive impairment. We explored Bayesian Variable Selection methods and compared the fitted final models with each other. Models were considered most promising when they combined good predictive ability in predicting patients' cognition, with clinical interpretability which is essential for convincing the clinical community of the value of any proposed variable selection methods.
Subject :Επιλογή μεταβλητών
Μπεϋζιανές μέθοδοι
Δεδομένα μεγάλης διάστασης
Variable selection
Bayesian methods
High dimensional data
Date Available :2024-09-12 16:42:56
Date Issued :10-09-2024
Date Submitted :2024-09-12 16:42:56
Access Rights :Free access
Licence :

File: Kalogirou_2024.pdf

Type: application/pdf