Εντοπίστηκε ένα σφάλμα στη λειτουργία της ΠΥΞΙΔΑΣ όταν χρησιμοποιείται μέσω του προγράμματος περιήγησης Safari. Μέχρι να αποκατασταθεί το πρόβλημα, προτείνουμε τη χρήση εναλλακτικού browser όπως ο Chrome ή ο Firefox. A bug has been identified in the operation of the PYXIDA platform when accessed via the Safari browser. Until the problem is resolved, we recommend using an alternative browser such as Chrome or Firefox.
 

Statistical and machine learning regularization techniques in clinical biostatistics: a comprehensive evaluation

dc.contributor.degreegrantinginstitutionAthens University of Economics and Business, Department of Statisticsen
dc.contributor.opponentDemiris, Nikolaosen
dc.contributor.opponentPsarakis, Steliosen
dc.contributor.thesisadvisorVasdekis, Vassilisen
dc.creatorΣταμάτης, Παναγιώτηςel
dc.creatorStamatis, Panagiotisen
dc.date.accepted10-06-2024
dc.date.accessioned2025-03-26T19:11:01Z
dc.date.available2025-03-26T19:11:01Z
dc.date.issued07-06-2024
dc.date.submitted2024-06-07 15:14:53
dc.description.abstractThe primary objective of this thesis is to investigate the efficacy of regularization techniques within the domain of clinical biostatistics. A comprehensive exploration of statistical and machine learning methodologies, including Penalization, Early Stopping, and Ensembling, is undertaken. Regularization, as defined, serves to control model complexity by incorporating additional information to address ill-posed problems or mitigate overfitting. Despite its conceptual clarity, the full extent of its applicability and diverse variants remains not entirely elucidated. Leveraging the R software, these techniques are applied to two distinct clinical datasets, both pertinent to prostate cancer research.The first dataset aims to classify patients into benign or malignant tumor categories, wherein Penalization, specifically Ridge Regression, demonstrates superior performance compared to alternative methods, achieving the lowest Misclassification Error (MCE) and highest Area Under the Curve (AUC). Furthermore, the second dataset endeavors to predict the logarithm of prostate-specific antigen (PSA), a significant biomarker, in conjunction with other clinical predictors. Once more, the penalization approach, notably Elastic Net, exhibits notable performance by yielding the lowest Mean Squared Error (MSE) and Mean Absolute Error (MAE). However, the outcomes for machine learning techniques are less promising, potentially attributable to the inherently simple data relationships or issues related to dimensionality. Overall, the study underscores the utility of regularization methods in enhancing predictive accuracy within clinical biostatistics, advocating for their broader adoption and further exploration within this domain.el
dc.description.abstractΟ βασικός στόχος αυτής της διατριβής είναι η εξέταση της αποτελεσματικότητας των τεχνικών κανονικοποίησης στον τομέα της κλινικής βιοστατιστικής. Πραγματοποιείται μια περιεκτική εξερεύνηση των στατιστικών και μηχανικής μάθησης μεθοδολογιών, συμπεριλαμβανομένων της τιμώρησης, της πρόωρης διακοπής και της συνδυασμένης μάθησης. Η κανονικοποίηση, όπως ορίζεται, εξυπηρετεί τον έλεγχο της πολυπλοκότητας του μοντέλου με την ενσωμάτωση επιπλέον πληροφοριών για την αντιμετώπιση ασαφών προβλημάτων ή τη μείωση του υπερ-εκπαιδευτικού φαινομένου. Παρά την έννοια της κανονικοποίησης, η πλήρης κατανόηση της εφαρμοσιμότητάς της και των διαφορετικών εκδοχών της παραμένει ακόμα μη ξεκάθαρη. Με χρήση του λογισμικού R, αυτές οι τεχνικές εφαρμόζονται σε δύο διαφορετικά κλινικά σύνολα δεδομένων, τα οποία είναι σχετικά με την έρευνα του προστάτη καρκίνου.Το πρώτο σύνολο δεδομένων στοχεύει στην ταξινόμηση των ασθενών σε καλοήθη ή κακοήθη όγκους, όπου η τεχνική τιμώρησης, και ειδικότερα η Ridge Regression, επιδεικνύει υψηλή απόδοση σε σύγκριση με τις εναλλακτικές μεθόδους, επιτυγχάνοντας το χαμηλότερο Missclassifcation Error (MCE) και την υψηλότερη Area Under the ROC Curve (AUC). Επιπλέον, το δεύτερο σύνολο δεδομένων στοχεύει στην πρόβλεψη του λογαρίθμου του ειδικού για τον προστάτη αντιγόνο (PSA), ενός σημαντικού βιοδείκτη, και την σχέση του με άλλες κλινικές μεταβλητές. Και πάλι, η μέθοδος της τιμώρησης, και ειδικότερα το Elastic Net, επιδεικνύει σημαντική απόδοση παρέχοντας το χαμηλότερα Mean Square Error (MSE) και Mean Absolute Error (MAE). Απροσδόκητα, τα αποτελέσματα για τις μεθόδους μηχανικής μάθησης δεν είναι τόσο ελπιδοφόρα, πιθανώς λόγω των απλών σχέσεων δεδομένων ή προβλημάτων που σχετίζονται με τη διάσταση. Συνολικά, η μελέτη υπογραμμίζει την χρησιμότητα των μεθόδων κανονικοποίησης στη βελτίωση της προβλεπτικής ακρίβειας στην κλινική βιοστατιστική, προωθώντας την ευρύτερη υιοθέτηση και περαιτέρω εξερεύνηση αυτών των μεθόδων σε αυτόν τον τομέα.en
dc.embargo.expire2024-06-07 15:14:53
dc.embargo.ruleOpen access
dc.format.extent160p.
dc.identifierhttp://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11463
dc.identifier.urihttps://pyxida.aueb.gr/handle/123456789/1760
dc.languageen
dc.rightsCC BY: Attribution alone 4.0
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectΚλινική βιοστατιστικήel
dc.subjectΤιμώρησηel
dc.subjectΜηχανική μάθησηel
dc.subjectΜοντελοποίησηel
dc.subjectClinical biostatisticsen
dc.subjectRegularizationen
dc.subjectMachine learning (ML)en
dc.subjectModelingen
dc.titleStatistical and machine learning regularization techniques in clinical biostatistics: a comprehensive evaluationen
dc.title.alternativeΜέθοδοι κανονικοποίησης στατιστικής και μηχανικής μάθησης στην κλινική βιοστατιστική: μια ολοκληρωμένη αξιολόγησηel
dc.typeText

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Stamatis_2024.pdf
Μέγεθος:
1.68 MB
Μορφότυπο:
Adobe Portable Document Format