Λογότυπο αποθετηρίου
 

Μεταπτυχιακές Εργασίες

Μόνιμο URI για αυτήν τη συλλογήhttps://pyxida.aueb.gr/handle/123456789/15

Περιήγηση

Πρόσφατες Υποβολές

Τώρα δείχνει 1 - 20 από 1191
  • Τεκμήριο
    Computational statistics and GPU acceleration
    (2025-07-28) Bampouris, Andreas; Μπαμπούρης, Ανδρέας; Vakeroudis, Stavros; Papagiannis, Georgios; Yannacopoulos, Athanasios
    Η πρακτική εφαρμογή σύγχρονων στατιστικών μεθόδων καθίσταται συχνά υπολογιστικά απαγορευτική, λόγω του διαρκώς αυξανόμενου όγκου των δεδομένων και της πολυπλοκότητας των μοντέλων. Η παρούσα εργασία εξετάζει πώς η επιτάχυνση μέσω Μονάδων Επεξεργασίας Γραφικών (GPU) μπορεί να διευρύνει το πεδίο εφαρμογής τέτοιων μεθόδων. Η εργασία δομείται σε τρεις άξονες: (1) τη θεωρητική ανάλυση των υπολογιστικών «σημείων συμφόρησης» σε δύο ευρέως διαδεδομένες αλλά και εξαιρετικά απαιτητικές μεθόδους, τις Μεθόδους Πυρήνα (Kernel Methods) και το Gradient Boosting, καθώς και του αλγοριθμικού ανασχεδιασμού που απαιτείται για την αποδοτική τους εκτέλεση σε GPU, (2) την εμπειρική επικύρωση των δυνητικών κερδών απόδοσης, μέσω της συγκριτικής αξιολόγησης δύο βιβλιοθηκών λογισμικού αιχμής σε GPU, των Falkon και XGBoost, έναντι των αντίστοιχων υλοποιήσεών τους σε CPU, ποσοτικοποιώντας την επιτάχυνση σε πραγματικά σύνολα δεδομένων, και (3) την επισκόπηση των πλαισίων λογισμικού που καθιστούν εφικτές τέτοιες υλοποιήσεις, χρησιμοποιώντας ως ενδεικτική μελέτη περίπτωσης την υλοποίηση ενός μαζικά παράλληλου δειγματολήπτη Markov Chain Monte Carlo (MCMC) σε CUDA. Τα αποτελέσματα καταδεικνύουν ότι η επίτευξη σημαντικών κερδών απόδοσης σε ευρέως διαθέσιμο υλικό GPU είναι εφικτή χωρίς καμία ουσιαστική απώλεια στατιστικής ακρίβειας, υπό την προϋπόθεση ότι οι αλγόριθμοι έχουν ανασχεδιαστεί ώστε να αξιοποιούν αποδοτικά τον παραλληλισμό και τις ιεραρχίες μνήμης. Γενικότερα, τα ευρήματα τεκμηριώνουν ότι η κλιμακωσιμότητα μεθόδων στατιστικής αποτελεί πρόβλημα τόσο μηχανικής λογισμικού, όσο και μεθοδολογίας: ο ανασχεδιασμός του αλγορίθμου, η δομή των δεδομένων, και η αρχιτεκτονική του υλικού απαιτούν συνδυαστική αντιμετώπιση. Προχωρώντας από τη θεωρία στην εμπειρική τεκμηρίωση και, τέλος, στην τεχνολογία της υλοποίησης, η παρούσα εργασία στοχεύει να γεφυρώσει το χάσμα μεταξύ της προηγμένης στατιστικής μοντελοποίησης και της υπολογιστικής υψηλών επιδόσεων, παρέχοντας τα εφόδια όχι μόνο για την αξιοποίηση των GPU, αλλά και για τη συνεισφορά στο ταχέως αναπτυσσόμενο αυτό πεδίο.
  • Τεκμήριο
    Testing for the assumptions of the Poisson-based football models
    (2025-07-02) Theodorakis, Angelos; Θεοδωράκης, Άγγελος; Karlis, Dimitrios; Chasiotis, Vasilis; Ntzoufras, Ioannis
    Η παρούσα διπλωματική εργασία εξετάζει βασικές παραδοχές στα μοντέλα ποδοσφαίρου βασισμένα στην κατανομή Poisson, εστιάζοντας ιδιαίτερα στο Overdispersion στο Αγγλικό Πρωτάθλημα της Premier League. Ο όρος Overdispersion αναφέρεται στην περίπτωση όπου η διακύμανση των αριθμών των τερμάτων είναι μεγαλύτερη από τον μέσο, και η εργασία διερευνά αν αυτό παρατηρείται στην Premier League. Η εργασία εξετάζει επίσης άλλες παραδοχές, όπως η υπερπληθώρα μηδενικών σκορ (αποτέλεσμα 0-0 ), πιθανές συσχετίσεις μεταξύ των σκορ των αντιπάλων ομάδων, καθώς και αν οι ικανότητες των ομάδων παραμένουν σταθερές ή εξελίσσονται με την πάροδο του χρόνου. Χρησιμοποιούνται διάφορες κατανομές, όπως Poisson, Negative Binomial, Inverse-Gaussian, Generalized Poisson και Conway-Maxwell Poisson, για να μοντελοποιηθεί το overdispersion. Οι κατανομές αξιολογούνται ως προς την προσαρμογή τους στα δεδομένα χρησιμοποιώντας κριτήρια όπως ο Δείκτης Πληροφορίας Akaike (AIC) και ο Δείκτης Πληροφορίας Bayesian (BIC). Τα αποτελέσματα δείχνουν ότι η κατανομή Poisson προσαρμόζεται καλά στα δεδομένα, όμως τείνει να υποεκτιμά τους αγώνες με μηδενικά τέρματα. Η κατανομή Negative Binomial έχει την καλύτερη προσαρμογή στα δεδομένα, ενώ η κατανομή Generalized Poisson κάνει και αυτή καλή προσαρμογή σε αντίθεση με τις κατανομές Inverse-Gaussian και Conway-Maxwell Poisson. Ωστόσο, η κακή προσαρμογή της κατανομής COM-Poisson ενδέχεται να οφείλεται στη χρήση method of moments για την εκτίμηση των παραμέτρων. Έπειτα, συγκρίνεται το overdispersion στους εντός και εκτός έδρας αγώνες ανά σεζόν και εξετάζεται η παρουσία του στις ομάδες της Premier League, σημειώνοντας διακυμάνσεις ανά σεζόν χωρίς όμως ξεκάθαρη τάση. Ορισμένες ομάδες, όπως η Newcastle και η West Ham, παρουσιάζουν σημαντικό overdispersion στους εκτός έδρας αγώνες, ενώ η Fulham εμφανίζει στους εντός έδρας αγώνες. Άλλες ομάδες, όπως η Huddersfield και η Wolves, παρουσιάζουν underdispersion. Στη συνέχεια ένα βασικό μοντέλο χρησιμοποιείται για κάθε μια από τις παραπάνω κατανομές, το οποίο περιλαμβάνει τις επιθετικές και αμυντικές ικανότητες κάθε ομάδας, τα τέρματα και το πλεονέκτημα έδρας ως παράγοντες. Μετά την προσαρμογή του μοντέλου Negative Binomial, το Dispersion Index ήταν για όλες τις σεζόν κοντά στη μονάδα, κάτι που υποδεικνύει ότι το μοντέλο εξήγησε την διασπορά. Εφαρμόζοντας επίσης μέθοδο bootstrap προκειμένου να συγκρίνουμε τις διαφορές των Deviance για τα μοντέλα Poisson και Negative Binomial, παρατηρούμε ότι δεν υπάρχουν σημαντικές ενδείξεις που να υποδεικνύουν ότι το μοντέλο Negative Binomial κάνει καλύτερη προσαρμογή. Ωστόσο, περαιτέρω αξιολόγηση με τα κριτήρια AIC και BIC έδειξε ότι, αν και το μοντέλο Poisson έχει καλή επίδοση, το μοντέλο Conway-Maxwell Poisson (COM-Poisson) προσφέρει καλύτερη προσαρμογή σε αρκετές σεζόν. Το underdispersion που παρατηρείται μετά την εφαρμογή του μοντέλου δείχνει ότι το αρχικό overdispersion εξηγήθηκε από το ίδιο το μοντέλο. Τέλος, η ενσωμάτωση των Τυχαίων Επιδράσεων στα μοντέλα, οι οποίες λαμβάνουν υπόψη τη μεταβλητότητα σε επίπεδο αγώνα, δεν βελτιώνει την προσαρμογή των μοντέλων Poisson, Negative Binomial και COM-Poisson, αλλά βελτιώνει την προσαρμογή του Generalized Poisson μοντέλου στις περισσότερες σεζόν. Συμπερασματικά, ενώ το μοντέλο Poisson παραμένει ένα αξιόπιστο εργαλείο για την ανάλυση των γκολ στην Premier League, το μοντέλο Conway-Maxwell-Poisson παρουσιάζει ακόμη καλύτερη προσαρμογή σε πολλές περιπτώσεις και δείχνει underdispersion μετά την προσαρμογή του μοντέλου, υποδηλώνοντας ότι η μεταβλητότητα που απομένει, είναι μικρότερη από αυτήν που θα υπέθετε το Poisson μοντέλο.
  • Τεκμήριο
    Εισαγωγή στον δυναμικό προγραμματισμό με αριθμητικές εφαρμογές
    (2025-07-16) Αρδούνη, Μαρία-Ελένη; Ardouni, Maria-Eleni; Ψαράκης, Στυλιανός; Δημητράκος, Θεοδόσης; Κυριακίδης, Επαμεινώνδας
    Ο Δυναμικός προγραμματισμός είναι ένας από τους πιο σημαντικούς κλάδους της Επιχειρησιακής Έρευνας και θεμελιώθηκε το 1953 από τον Richard Bellman. Στηρίζεται στην αρχή της βελτιστοποίησης και αποτελεί μέθοδο η οποία μπορεί να χρησιμοποιηθεί όταν τα υποπροβλήματα του κύριου προβλήματος δεν είναι ανεξάρτητα μεταξύ τους. Η μέθοδος επίλυσης τέτοιων προβλημάτων βασίζεται σε μία κατάλληλη αναδρομική σχέση και με τη σύνθεση των αποφάσεων των υποπροβλημάτων προκύπτει η ζητούμενη απόφαση. Στόχος της παρούσας διπλωματικής εργασίας είναι να αναλύσει τη χρησιμότητα του Δυναμικού Προγραμματισμού τόσο στην καθημερινή ζωή όσο και στους επιχειρηματικούς και οικονομικούς κλάδους. Στο πρώτο κεφάλαιο παρατίθεται ένα χαρακτηριστικό παράδειγμα του Δυναμικού Προγραμματισμού η εύρεση της βέλτιστης διαδρομής. Στη συνέχεια στα κεφάλαια 2 και 3 καταγράφονται τα χαρακτηριστικά του Δυναμικού Προγραμματισμού και οι κατηγορίες των προβλημάτων του. Ακόμη στο τρίτο κεφάλαιο παρατίθενται παραδείγματα από την κατηγορία των Ντετερμινιστικών προβλημάτων καθώς και ένα παράδειγμα γραμμικού προγραμματισμού το οποίο επιλύεται με διαφορετικούς τρόπους. Τέλος στο τέταρτο και τελευταίο κεφάλαιο περιγράφονται και επιλύονται παραδείγματα των προβλημάτων που ανήκουν στην κατηγορία των Στοχαστικών προβλημάτων.
  • Τεκμήριο
    Μία μη παραμετρική προσέγγιση για την μέτρηση του χρηματοοικονομικού κινδύνου με χρήση πυρήνων πιθανότητας
    (2025-07-10) Σημαντήρης, Ιωάννης; Γιαννακόπουλος, Αθανάσιος; Παπαγιάννης, Γεώργιος; Μπαλτάς, Ιωάννης
    Η παρούσα εργασία επικεντρώνεται στην μέτρηση του χρηματοοικονομικού κινδύνου χρησιμοποιώντας το μέτρο της VaR μέσα σε ένα μη παραμετρικό πλαίσιο που χαρακτηρίζεται από την χρήση πυρήνων πιθανότητας. Βασικό χαρακτηριστικό της συγκεκριμένης προσέγγισης είναι ότι χρησιμοποιεί την μέθοδο των συναρτήσεων πυρήνα για την εκτίμηση της κατανομής των αποδόσεων που απαρτίζουν την θέση μας. Παράλληλα, η συγκεκριμένη προσέγγιση θα συγκριθεί με δύο κλασσικές μεθόδους υπολογισμού της VaR, αυτήν της υπόθεσης ότι οι ημερήσιες αριθμητικές αποδόσεις ακολουθούν κανονική κατανομή, την μέθοδο της απλής ιστορικής προσομοίωσης, η οποία χρησιμοποιεί ιστορικά δεδομένα για την εκτίμηση της (VaR) βασιζόμενη στην εμπειρική κατανομή όπως αυτή περιγράφεται από το ιστόγραμμα. Χρησιμοποιήσαμε την εκτίμηση με χρήση πυρήνων πιθανότητας που είναι μια μη παραμετρική και στατιστικά προηγμένη μέθοδος, έτσι ώστε να μην ακολουθήσουμε τα κλασικά πλαίσια μέτρησης της αξίας σε κίνδυνο. Ο λόγος για τον οποίο προβήκαμε σε αυτή την μεθοδολογία είναι για να μπορέσουμε να περιγράψουμε με μεγαλύτερη ακρίβεια την κατανομή των αποδόσεων. Μέσα σε ένα πλαίσιο backtesting για την αξιολόγηση των μεθόδων ως προς την ικανότητα τους να μετρούν ικανοποιητικά και με ακρίβεια τον χρηματοοικονομικό κίνδυνο διεξήχθησαν τρεις ανάστροφοι έλεγχοι Kupiec, Christoffersen, Basel Traffic Light Test. Στο πρώτο κεφάλαιο γίνεται μια βασική εισαγωγή στην έννοια του κινδύνου, παρουσιάζεται το μέτρο της αξίας σε κίνδυνο και παρουσιάζεται το στατιστικό πλαίσιο που διέπει την παρούσα εργασία. Στο δεύτερο κεφάλαιο, πραγματοποιείται μια εμπειρική εφαρμογή των μεθόδων σε δεδομένα από τέσσερις ευρωπαϊκούς χρηματιστηριακούς δείκτες: IBEX 35, CAC 40, DAX και EURO STOXX 50. Τα δεδομένα καλύπτουν την περίοδο από 01/01/2015 έως 31/01/2025 και προέρχονται από την διαδικτυακή πλατφόρμα χρηματοοικονομικών δεδομένων Yahoo Finance. Η μεθοδολογία βασίζεται στην εφαρμογή των μεθόδων VaR με χρήση κινητών παραθύρων δύο χρονικών διαστημάτων 125 και 250 ημερών. Τελικά, καταγράφηκαν ως αποτελεσματικότερες οι μέθοδοι Historical VaR, KDE-based μέθοδοι ενώ η Normal VaR όπως αναμενόταν απεδείχθη ως η πιο αναποτελεσματική.
  • Τεκμήριο
    Models for expected field goals in basketball
    (2025-06-30) Tsadimas, Anargyros; Τσαδήμας, Ανάργυρος; Karlis, Dimitrios; Ntzoufras, Ioannis; Pelechrinis, Konstantinos
    Τα τελευταία χρόνια, η αναλυτική προσέγγιση έχει αλλάξει ριζικά τον τρόπο με τον οποίο βλέπουμε το μπάσκετ — από την αξιολόγηση παικτών και σουτ, μέχρι τον σχεδιασμό επιθετικών στρατηγικών. Αφορμή για την παρούσα μελέτη στάθηκαν αναλύσεις πάνω στα corner 3s, που έδειξαν πως η υψηλή τους αποτελεσματικότητα δεν οφείλεται τόσο στη μικρότερη απόσταση, όσο στη μεγάλη πιθανότητα να προκύπτουν από assist. Αυτό έθεσε το ερώτημα: μήπως και κάποια σουτ μέσης απόστασης έχουν παρόμοια κρυμμένη αξία; Με βάση δεδομένα καταγραφής παικτών και φάσεων από τις σεζόν NBA 2013–14 και 2014–15, δημιουργήθηκαν μοντέλα που εκτιμούν την πιθανότητα ευστοχίας (xFG%) με βάση στοιχεία όπως η θέση στο γήπεδο, ο χρόνος στο ρολόι, η απόσταση του αμυντικού, ο τύπος σουτ και ο χρόνος που κρατήθηκε η μπάλα. Η ανάλυση έδειξε ότι τα catch-and-shoot σουτ — όταν εκτελούνται γρήγορα — έχουν αυξημένα ποσοστά επιτυχίας. Η απόσταση του αμυντικού, η διαφορά στο σκορ και ο χρονισμός της επίθεσης παίζουν επίσης σημαντικό ρόλο. Το τελικό μοντέλο ενσωματώνει και στοιχεία ανά παίκτη μέσω LASSO, αναδεικνύοντας κάποιους κορυφαίους σουτέρ μέσης απόστασης που ξεχωρίζουν. Πέρα από την πρόβλεψη ευστοχίας, το επίκεντρο της μελέτης είναι η ποιότητα της επιλογής σουτ — δηλαδή όχι μόνο αν μπήκε, αλλά αν άξιζε να εκτελεστεί. Τα αποτελέσματα δείχνουν ότι συγκεκριμένοι παίκτες και σημεία στο γήπεδο προσφέρουν υψηλή αξία, ξεπερνώντας μάλιστα σε αποδοτικότητα τον μέσο όρο των τριπόντων. Η σωστή ανακατανομή τέτοιων προσπαθειών μπορεί να δώσει μετρήσιμο πλεονέκτημα σε βάθος σεζόν.
  • Τεκμήριο
    Hidden Markov Models and their application in modeling rainfall occurrence
    (2025-06-06) Grammenos, Konstantinos; Γραμμένος, Κωνσταντίνος; Pavlopoulos, Charalampos; Yannacopoulos, Athanasios; Besbeas, Panagiotis
    Η μοντελοποίηση δεδομένων ημερήσιων βροχοπτώσεων αποτελεί σημαντικό πεδίο έρευνας ιδίως σε περιοχές όπως η βορειοανατολική Βραζιλία, όπου οι καιρικές συνθήκες επηρεάζονται από σύνθετα φαινόμενα που σχετίζονται με την ατμόσφαιρα και τη θερμοκρασία του ωκεανού. Η ανάπτυξη στοχαστικών μοντέλων είναι απαραίτητη για την κατανόηση των μοτίβων βροχόπτωσης, τη διαχείριση υδάτινων πόρων και την πρόβλεψη μελλοντικών φαινομένων. Στην παρούσα διατιβή διερευνάται η χρήση Κρυφών Μαρκοβιανών Μοντέλων (HMMs) για τη μοντελοποίηση ημερήσιων δεδομένων βροχόπτωσεων σε περιόδο 90 ημερών, για 24 χρόνια (1975–2002) στην πολιτεία Ceará της Βορειοανατολικής Βραζιλίας. Αρχικά, παρουσιάζεται εφαρμογή στα δυαδικά δεδομένα του θερμοπίδακα ”Old Faithful”, ως εισαγωγή στα HMMs. Έπειτα, εφαρμόζονται ομοιογενή HMMs στα δεδομένα βροχοπτώσεων, αποκαλύπτοντας 4 υποβόσκουσες καταστάσεις: δύο που αντιστοιχούν σε βροχερές και ξηρές συνθήκες και δύο μεταβατικές, με αντίστροφες πιθανοτήτες βροχοπτώσης μεταξύ βόρειων και νότιων σταθμών. Η ανάλυση συνεχίζεται με την ενσωμάτωση εξωτερικών κλιματικών δεδομένων μεγάλης κλίμακας και πιο συγκεκριμένα της προσομοιωμένης εποχικής μέσης απόκλισης βροχόπτωσης που προέρχεται από ένα μοντέλο Γενικής Κυκλοφορίας (GCM), ως εξωτερικής μεταβλητής σε ένα μη ομοιογενές HMM (NHMM). Με το μοντέλο αυτό, αποδεικνύεται ότι αυτή η εξωτερική μεταβλητή επηρεάζει τη μετάβαση μεταξύ των καταστάσεων. Επιπλέον, η ίδια μεταβλητή ενσωματώνεται μέσω λογιστικής παλινδρόμησης στη διαδικασία παρατήρησης. Το βέλτιστο από αυτά μοντέλο, δείχνει πως ενώ κάθε σταθμός παρουσιάζει διαφορετική βασική πιθανότητα βροχής, η επίδραση της κλιματικής μεταβλητής είναι συνεπής σε όλη την περιοχή. Τέλος, εξετάζεται εναλλακτική προσέγγιση όπου κάθε έτος μοντελοποιείται ως ανεξάρτητη εποχική ακολουθία αντί μια συνεχόμενη σειρά 2,160 ημερών. Τα αποτελέσματα υπογραμμίζουν τη σημασία των HMMs και της ενσωμάτωσης κλιματικών μεταβλητών στην κατανόηση και πρόβλεψη των βροχοπτώσεων.
  • Τεκμήριο
    Credit risk and credit derivatives
    (2025-06-20) Boci, Konstadin; Μπότσι, Κωνσταντίν; Zimbidis, Alexandros; Vakeroudis, Stavros; Yannacopoulos, Athanasios
    Πιστωτικός Κίνδυνος & Μηχανική Μάθηση Ο πιστωτικός κίνδυνος αναφέρεται στην πιθανότητα ο δανειολήπτης να μην μπορεί να αποπληρώσει τα δάνειά του, κάτι που προκαλεί οικονομικές απώλειες για τον δανειστή. Ο κίνδυνος αυτός είναι εγγενής σε διάφορα χρηματοοικονομικά προϊόντα, όπως τα δάνεια και τα ομόλογα. Οι απώλειες που μπορεί να υποστεί ο επενδυτής περιλαμβάνουν: Χαμένα κεφάλαια, Μη ληφθέντες τόκους, Μειωμένες ταμειακές ροές. Σε αυτό το έργο, εστιάζουμε σε θεμελιώδη και στατιστικά μοντέλα μηχανικής μάθησης για: Την εκτίμηση, Τη μοντελοποίηση, Τη διαχείριση του πιστωτικού κινδύνου, καθώς και στη μελέτη παραγώγων συμβολαίων με στόχο τη μείωση και διαχείρισή του. Ορισμένες ιδιότητες που δυσκολεύουν την ποσοτική μοντελοποίηση του πιστωτικού κινδύνου είναι: Τα γεγονότα χρεοκοπίας είναι σπάνια και συχνά απροσδόκητα, οι ζημιές είναι σημαντικές και το μέγεθος των απωλειών δεν είναι γνωστό πριν τη χρεοκοπία. Μοντέλα Μηχανικής Μάθησης Υπάρχουν πολλά μοντέλα μηχανικής μάθησης, και η καταλληλότητα του καθενός εξαρτάται από τις μεταβλητές που έχουμε διαθέσιμες. Η επιλογή αλγορίθμου βασίζεται σε παράγοντες όπως: Τύπος δεδομένων, Διαφάνεια χαρακτηριστικών (features), Διαλειτουργικότητα (interoperability). 1. Λογιστική Παλινδρόμηση (Logistic Regression) Μοντελοποιεί πιθανότητες στο διάστημα [0,1] χρησιμοποιώντας τη λογιστική συνάρτηση (logit). Συχνά εφαρμόζονται τεχνικές κανονικοποίησης όπως: Lasso, Ridge, Elastic Net, για να αποφευχθεί η υπερπροσαρμογή (overfitting). 2. SVM (Support Vector Machine) Χρησιμοποιεί υπερεπίπεδο (hyperplane) σε πολυδιάστατο χώρο για να διαχωρίσει δύο κατηγορίες. Με τη χρήση πυρηνικών συναρτήσεων (kernel functions) μπορεί να μοντελοποιήσει μη γραμμικά προβλήματα ταξινόμησης. 3. Naive Bayes Βασίζεται στο θεώρημα του Bayes και απαιτεί την ισχυρή υπόθεση της ανεξαρτησίας των χαρακτηριστικών. Αν και απλός στην υλοποίηση, έχει συχνά χαμηλή απόδοση όταν η υπόθεση ανεξαρτησίας δεν ισχύει. 4. Δέντρα Απόφασης (Decision Trees) Η πρόβλεψη γίνεται μέσω διαδοχικών κόμβων και διακλαδώσεων. Παρότι είναι ευέλικτο εργαλείο, παρουσιάζουν συχνά υπερπροσαρμογή. Για την αντιμετώπιση αυτού, χρησιμοποιούμε το: 5. Random Forest - Αποτελεί σύνολο από πολλά δέντρα απόφασης, όπου κάθε δέντρο εκπαιδεύεται με τυχαίο υποσύνολο δεδομένων και χαρακτηριστικών. Η τυχαιότητα μειώνει τον κίνδυνο υπερπροσαρμογής και βελτιώνει τη συνολική απόδοση πρόβλεψης.
  • Τεκμήριο
    Χρήση διαγραμμάτων ελέγχου για την παρακολούθηση καλής λειτουργίας ανεμογεννητριών, προβλεπτική συντήρηση δομικών εξαρτημάτων και εφαρμογές σε ανανεώσιμες πηγές ενέργειας
    (2025-06-13) Σχοινάς, Βασίλειος; Παπασταμούλης, Παναγιώτης; Βρόντος, Ιωάννης; Ψαράκης, Στυλιανός
    Περισσότερο από ποτέ, ο ενεργειακός ανασχηματισμός παίζει καθοριστικό ρόλο στην διαμόρφωση των πολιτικών, των κοινωνικών συμπεριφορών, της οικονομίας και της βιομηχανικής παραγωγής. Η αιολική ενέργεια, παίζει έναν καθοριστικό ρόλο στον μετασχηματισμό αυτό. Επιπλέον, η αναβάθμιση των ενεργειακών αγορών, η ανάγκη χειρισμών και αποφάσεων σε πραγματικό χρόνο, η πληθώρα δεδομένων και η ανάγκη για αδιάλειπτη παροχή ηλεκτρικής ενέργειας σε εξισορροπημένα και ευσταθή δίκτυα, οδηγούν στην ανάπτυξη νέων τεχνικών ελέγχου. Τα διαγράμματα ελέγχου, άμεσα συνδεδεμένα με τις παραγωγικές διαδικασίες, δεν θα μπορούσαν να μην αποτελούν ένα ισχυρό εργαλείο για όσους και όσες ασχολούνται με την λειτουργεία και συντήρηση ανεμογεννητριών. Οι νέες προκλήσεις αντιμετωπίζονται με νέες αρχιτεκτονικές στατιστικών ελέγχων. Τα διαγράμματα ελέγχου, λόγω της ερμηνευσιμότητάς τους μπορούν να συνεισφέρουν, είτε αυτούσια, είτε ως κομμάτια υβριδικών τεχνικών με μοντέλα μηχανικής μάθησης. Σε αυτήν την εργασία παρουσιάζεται μία συστηματική ανασκόπηση και αναφορά των πιο πρόσφατων εφαρμογών διαγραμμάτων ελέγχου στις ΑΠΕ, και συγκεκριμένα στην αιολική ενέργεια. Παράλληλα, παρουσιάζονται κάποιες πρωτότυπες εφαρμογές σε πραγματικά case studies, με στόχο την ανάδειξη των διαγραμμάτων ελέγχου και των δυνατοτήτων τους.
  • Τεκμήριο
    Mixture cure models for credit scoring
    (2025-04-16) Papageorgiou, Athina; Παπαγεωργίου, Αθηνά; Ntzoufras, Ioannis; Spelta, Alessandro; Karlis, Dimitrios
    Η αξιολόγηση πιστοληπτικής ικανότητας αποτελεί ένα κρίσιμο ζήτημα για τις τράπεζες, οι οποίες επιδιώκουν να αναγνωρίζουν δανειολήπτες με καλή πιστοληπτική ικανότητα και να ελαχιστοποιούν τις πιθανές οικονομικές απώλειες που προκαλούνται από τον κίνδυνο αθέτησης. Ωστόσο, η προσοχή έχει μετατοπιστεί από τον απλό καθορισμό της καταλληλόλητας ενός δανειολήπτη για δάνειο, στην εκτίμηση των πιθανοτήτων αθέτησης σε διαφορετικά χρονικά σημεία. Για την αντιμετώπιση αυτής της πρόκλησης, αυτή η διπλωματική εργασία προτείνει τη χρήση της ανάλυσης επιβίωσης, ένα ισχυρό στατιστικό εργαλείο που χρησιμοποιείται πρωτίστως στη βιοστατιστική για τη μοντελοποίηση του χρόνου μέχρι την εμφάνιση ενός γεγονότος. Σε αυτό το πλαίσιο, η ανάλυση επιβίωσης εφαρμόζεται για τη μοντελοποίηση του χρόνου μέχρι την αθέτηση ενός δανειολήπτη. Είναι σημαντικό να σημειωθεί ότι υπάρχει ένας υποπληθυσμός δανειοληπτών που δεν θα αθετήσουν ποτέ, γνωστός και ως «θεραπευμένος» (cured). Για να ληφθεί υπόψη αυτή η περίπτωση, χρησιμοποιούνται μοντέλα μικτής θεραπείας (mixture cure models), τα οποία συνδυάζουν ένα μέρος για την εκτίμηση του ποσοστού θεραπείας (cure rate) και ένα μέρος επιβίωσης για τη μοντελοποίηση του χρόνου μέχρι το γεγονός για τους ευπαθείς δανειολήπτες. Σε αυτή τη μελέτη, προτείνουμε δύο μοντέλα: ένα κλασικό μοντέλο Weibull και ένα μικτό μοντέλο θεραπείας. Το μικτό μοντέλο θεραπείας αποτελείται από ένα μέρος λογιστικής παλινδρόμησης για το ποσοστό θεραπείας και ένα στοιχείο με Weibull κατανομή για τις πιθανότητες επιβίωσης των ευπαθών δανειοληπτών. Και τα δύο μοντέλα εφαρμόζονται σε ένα σύνολο δεδομένων στεγαστικών δανείων με διαφορετικά χαρακτηριστικά. Τα μοντέλα αξιολογούνται ως προς της προσαρμοστικότητας στα δεδομένα χρησιμοποιώντας τον εκτιμητή Kaplan-Meier και γραφήματα καταλοίπων. Επιπλέον, η προβλεπτική τους ικανότητα αξιολογείται με τη χρήση διχοτόμησης των δεδομένων σε training και test datasets. Τα αποτελέσματα δείχνουν ότι το μικτό μοντέλο θεραπείας όχι μόνο έχει καλύτερη προσαρμογή στα δεδομένα, αλλά παρέχει και πιο ακριβείς προβλέψεις σε σύγκριση με το κλασικό μοντέλο Weibull.
  • Τεκμήριο
    Loss reserving models: a comparative study
    (2025-05-12) Faros, Charalampos; Φάρος, Χαράλαμπος; Yannacopoulos, Athanasios; Zimpidis, Alexandros; Papagiannis, Georgios
    Το θέμα της παρούσας μεταπτυχιακής εργασίας είναι οι μέθοδοι αποθεματοποίησης ζημιών στα πλαίσια των αναλογιστικών τριγώνων. Αρχικά, παρουσιάζουμε τα στατιστικά εργαλεία που θα χρειαστούν στην κατανόηση των μεθόδων και εξηγούμε τη σημειογραφία που θα ακολουθήσουμε στην εργασία. Στη συνέχεια, παρουσιάζουμε τις βασικές μεθόδους εκτίμησης των αποθεμάτων και προτείνουμε μια νέα Μπεϋζιανή μέθοδο αποθεματοποίησης. Οι βασικές μέθοδοι χωρίζονται σε δύο κύριες κατηγορίες: (1) στις μεθόδους που υποθέτουν την ύπαρξη μοτίβου στα έτη εξέλιξης και (2) στις μεθόδους παλινδρόμησης, και αφορούν εκτιμήσεις για μεμονωμένα αναλογιστικά τρίγωνα. Επιπλέον, παρουσιάζουμε μια μέθοδο (της πρώτης κατηγορίας) για πολλά συσχετιζόμενα τρίγωνα. Παρόλο που οι παραπάνω μέθοδοι είναι απλές και εύχρηστες στερούνται τον υπολογισμό του μέτρου μεταβλητότητας των εκτιμήσεων των αποθεμάτων. Αντίθετα, η προτεινόμενη Μπεϋζιανή προσέγγιση δίνει μια καλή λύση στα πολλά συσχετιζόμενα τρίγωνα δίνοντας ταυτόχρονα τις κατανομές για κάθε ποσότητα που χρειάζεται. Τέλος, εφαρμόζουμε τις παραπάνω μεθόδους σε πραγματικά δεδομένα και σχολιάζουμε τα αποτελέσματα.
  • Τεκμήριο
    Modeling oil market series using econometric models and machine learning techniques
    (2025-05-06) Μπέκας, Αναστάσιος; Bekas, Anastasios; Besbeas, Panagiotis; Psarakis, Stelios; Vrontos, Ioannis
    Η παρούσα διπλωματική εργασία εξετάζει τη δυναμική των τιμών του αργού πετρελαίου, εστιάζοντας στις αποδόσεις των δεικτών WTI, Brent και Dubai. Μέσω της ενσωμάτωσης οικονομετρικών μοντέλων, όπως ARMA-GARCH, με τεχνικές μηχανικής μάθησης, όπως Random forest, Support Vector Regression, η μελέτη αναλύει την πολυπλοκότητα της συμπεριφοράς των τιμών του πετρελαίου, περιλαμβάνοντας μη γραμμικές εξαρτήσεις και συστάδες μεταβλητότητας. Η ανάλυση λαμβάνει υπόψη τις δομικές αλλαγές από σημαντικά παγκόσμια γεγονότα, όπως η χρηματοπιστωτική κρίση και η πανδημία COVID-19, για τη βελτίωση της ακρίβειας των προβλέψεων. Εξωτερικοί μακροοικονομικοί παράγοντες και δείκτες αβεβαιότητας πολιτικής εντοπίζονται ως καθοριστικοί παράγοντες που επηρεάζουν τη δυναμική της αγοράς πετρελαίου. Τα ευρήματα υπογραμμίζουν την αξία του συνδυασμού παραδοσιακών και σύγχρονων μεθοδολογιών για την αντιμετώπιση των σύνθετων προκλήσεων των αγορών ενέργειας. Η μελέτη καταλήγει σε πρακτικά συμπεράσματα για τους φορείς χάραξης πολιτικής και τους συμμετέχοντες στην αγορά, τονίζοντας τη σημασία των υβριδικών προσεγγίσεων και τις δυνατότητες των εναλλακτικών πηγών δεδομένων για τη βελτίωση των μοντέλων πρόβλεψης.
  • Τεκμήριο
    On some recent developments of Time-Between-Events control charts
    (2025-05-06) Ξυλάς, Αντώνιος; Xylas, Antonios; Vrontos, Ioannis; Besbeas, Panagiotis; Psarakis, Stelios
    Τα διαγράμματα ελέγχου Time Between Events (TBE) χρησιμοποιούνται για την παρακολούθηση των διαδικασιών υψηλής απόδοσης για τον γρήγορο και ακριβή εντοπισμό τυχόν αλλαγών στη διαδικασία. Για το λόγο αυτό, θεωρούνται χρήσιμο εργαλείο στον στατιστικό έλεγχο της διαδικασίας (SPC). Ο κύριος στόχος αυτής της μεθόδου είναι η βελτίωση της αποδοτικότητας της διαδικασίας με τον εντοπισμό αποκλίσεων σε βάθος χρόνου, επιτρέποντας την άμεση παρέμβαση. Τα διαγράμματα ελέγχου TBE θεωρούνται πολύτιμα σε διάφορους επαγγελματικούς τομείς, όπως υγειονομική περίθαλψη, εξυπηρέτηση πελατών, αλλά και σε απλούστερους τομείς όπως η μεταποίηση. Στην παρούσα μελέτη , εξετάστηκαν διάφορα διαφορετικά διαγράμματα ελέγχου, συμπεριλαμβανομένων των διαγραμμάτων EWMA, CUSUM, και Shewhart, καθώς και συνδυασμοί αυτών των μεθόδων. Επιπλέον, εφαρμόστηκαν διάφορες τεχνικές που χρησιμοποιούν διαγράμματα ελέγχου Time Between Events (TBE) και πραγματοποιήθηκαν προσομοιώσεις για ορισμένες από αυτές τις μεθόδους για να συγκριθούν οι επιδόσεις και τα αποτελέσματά τους.
  • Τεκμήριο
    Flexible survival modelling with incorporation of external information for robust long-term extrapolations
    (2025-04-11) Καλατζή, Μαριλένα; Kalatzi, Marilena; Karlis, Dimitrios; Ntzoufras, Ioannis; Demiris, Nikolaos
    Οι Αξιολογήσεις Τεχνολογιών Υγείας (HTAs) έχουν κρίσιμο ρόλο στην αξιολόγηση νέων ιατρικών παρεμβάσεων. Τα μακροχρόνια δεδομένα είναι απαραίτητα για αξιόπιστες αποφάσεις, καθώς η περίοδος παρακολούθησης των μελετών, ιδίως σε μελέτες σχετικές με την ογκολογία, είναι συχνά περιορισμένη. Η παρεκβολή είναι επομένως σημαντική για τη διαμόρφωση πολιτικών υγείας και τη μοντελοποίηση του κόστους αποτελεσματικότητας. Συμβάλλει στην ολοκληρωμένη κατανόηση των πιθανών ωφελειών και κινδύνων μιας θεραπείας, διασφαλίζοντας ότι οι αποφάσεις στον τομέα της υγείας βασίζονται σε ισχυρά και αξιόπιστα δεδομένα. Τα παραδοσιακά παραμετρικά μοντέλα επιβίωσης, καθώς και οι ευέλικτες παραμετρικές προσεγγίσεις, χρησιμοποιούνται ευρέως για την παρεκβολή των δεδομένων. Ωστόσο, συχνά παράγουν κλινικά, μη ρεαλιστικά αποτελέσματα. Η παρούσα διατριβή διερευνά μια νέα προσέγγιση για την παρεκβολή των δεδομέων επιβίωσης, χρησιμοποιώντας M-splines που ενσωματώνουν εξωτερικά δεδομένα μέσα σε ένα μπεϋζιανό πλαίσιο. Τα M-splines εφαρμόζονται στη συνάρτηση κινδύνου, με την ευελιξία τους να καθορίζεται από ασθενώς πληροφοριακές εκ των προτέρων κατανομές και την τοποθεσία των κόμβων. Για την αποφυγή της υπερπροσαρμογής, το μοντέλο αρχικά περιλαμβάνει ένα μεγάλο αριθμό κόμβων, οι οποίοι μειώνονται κατά τη διαδικασία προσαρμογής του μοντέλου μέχρι να επιτευχθεί το κατάλληλο επίπεδο ευελιξίας. Διάφορες πηγές εξωτερικής πληροφορίας μπορούν να συνδυαστούν από κοινού με τα δεδομένα της κλινικής δοκιμής, βελτιώνοντας την ακρίβεια της παρεκβολής, ενώ παράλληλα συμβάλουν στην παραγωγή κλινικά ρεαλιστικών εκτιμήσεων για μακροπρόθεσμο χρονικό διάστημα. Η νέα μεθοδολογία, μαζί με τα συμβατικά μοντέλα που χρησιμοποιούνται για την παρεκβολή, εφαρμόστηκαν σε ένα πραγματικό σύνολο δεδομένων επιβίωσης σε ασθενείς με μη μικροκυτταρικό καρκίνο του πνεύμονα (NSCLC). Τα αποτελέσματα της ανάλυσης αναδεικνύουν την αποτελεσματικότητα της νέας προσέγγισης. Οι μέσες εκτιμήσεις της πενταετούς επιβίωσης ήταν σε συμφωνία με τις τιμές που βασίζονται στη βιβλιογραφία, ενώ παράλληλα ήταν αξιόπιστες, όπως υποδεικνύεται από τα σχετικά στενά διαστήματα αξιοπιστίας. Συγκρίνοντας τα έτη ζωής που εκτιμήθηκαν για τις δύο ομάδες θεραπείας, παρατηρήθηκε σημαντική διαφορά στις εκτιμήσεις των δύο προσεγγίσεων. Τα μοντέλα που χρησιμοποιούν M-splines εκτίμησαν πέντε επιπλέον μήνες ζωής, σε σύγκριση με μόλις ένα μήνα από τα τυπικά παραμετρικά μοντέλα. Αυτή η απόκλιση αναδεικνύει τις προκλήσεις που αντιμετωπίζουν τα τελευταία μοντέλα, τα οποία δεν συνέκλιναν στο μηδέν μετά από εκτεταμένη χρονική περίοδο, επηρεάζοντας έτσι τις μέσες εκτιμήσεις. Τα ευρήματα της έρευνας αυτής, αναδεικνύουν τη σημασία των ευέλικτων μοντέλων επιβίωσης που ενσωματώνουν εξωτερικές πηγές δεδομένων στις αξιολογήσεις της υγειονομικής περίθαλψης. Αν και οι δύο μέθοδοι που εφαρμόστηκαν δεν μπορούν να συγκριθούν με στατιστικά κριτήρια, η νέα προσέγγιση ενισχύει τη σταθερότητα και την αξιοπιστία των μακροπρόθεσμων προβλέψεων, καθιστώντας την ένα πολύτιμο εργαλείο στις οικονομικές αξιολογήσεις της υγείας.
  • Τεκμήριο
    Κίνηση Brown
    (2025-04-03) Ζυγάς, Σωτήριος; Γιαννακόπουλος, Αθανάσιος; Ζαζάνης, Μιχαήλ; Βακερούδης, Σταύρος
    Η παρούσα Διπλωματική εργασία ασχολείται με την Κίνηση Brown, μία από τις πιο σημαντικές στοχαστικές διαδικασίες στη θεωρία πιθανοτήτων και τη μαθηματική χρηματοοικονομική. Αρχικά, γίνεται ανάλυση των στοχαστικών διαδικασιών, των martingales και της δεσμευμένης μέσης τιμής ως προς τους ορισμούς και τις ιδιότητες τους που αποτελούν θεμελιώδη εργαλεία για τη μελέτη της. Στη συνέχεια, παρουσιάζονται οι βασικές έννοιες και ιδιότητες της Κίνησης Brown, καθώς και η ιστορική της αναδρομή. Ειδική έμφαση δίνεται στο Ολοκλήρωμα Itô και στον τύπο του Itô, που επιτρέπουν τη μαθηματική περιγραφή της εξέλιξης τυχαίων φαινομένων. Επιπλέον, παρουσιάζεται η εφαρμογή της Κίνησης Brown στη χρηματοοικονομική, με επίκεντρο το μοντέλο Black-Scholes για την τιμολόγηση δικαιωμάτων προαίρεσης. Τέλος, εξετάζονται οι πρακτικές εφαρμογές της Κίνησης Brown σε διάφορους τομείς, όπως η φυσική, η βιολογία, η ανάλυση ιατρικών εικόνων και η τυχαία πλοήγηση ρομποτικών συστημάτων. Η εργασία ολοκληρώνεται με βιβλιογραφική ανασκόπηση και επίλογο που αναδεικνύουν τη σημασία της Κίνησης Brown στην ανάλυση και μοντελοποίηση στοχαστικών διαδικασιών.
  • Τεκμήριο
    Bayesian ANOVA and multiplicity adjustment
    (2025-03-21) Μαμούγκα, Άλκηστη; Mamougka, Alkisti; Papastamoulis, Panagiotis; Tsiamyrtzis, Panagiotis; Ntzoufras, Ioannis
    Η παρούσα διατριβή εξετάζει τη Bayesian ANOVA ως εναλλακτική προσέγγιση έναντι των κλασικών μεθόδων, εστιάζοντας στα πλεονεκτήματά της στη διαχείριση πολλαπλών συγκρίσεων και την αξιοποίηση της α πριόρι πληροφορίας. Οι παραδοσιακές μέθοδοι ANOVA βασίζονται στα p-value και απαιτούν αυθαίρετες διορθώσεις πολυπλοκότητας, όπως η Bonferroni, προκειμένου να ελεγχθεί ο κίνδυνος ψευδών ανακαλύψεων. Αντίθετα, η Μπεϋζιανή ANOVA ενσωματώνει φυσικά τη διόρθωση πολυπλοκότητας μέσω των εκ των προτέρων κατανομών. Το κυριότερο κομμάτι της μελέτης βασίζεται σε μια προσομοίωση, στην οποία εφαρμόζουμε Bayesian ANOVA με διαφορετικές επιλογές α πριόρι κατανομών. Εξετάζουμε την επίδραση των κατανομών αυτών στην επιλογή μοντέλου, την ακρίβεια των συμπερασμάτων και τη διαχείριση των πολλαπλών συγκρίσεων. Επιπλέον, διερευνούμε την εφαρμογή της Bayesian ANOVA σε πραγματικά δεδομένα, εστιάζοντας σε παράγοντες που επηρεάζουν την απόδοση των αθλητών στον μαραθώνιο. Τα αποτελέσματα αναδεικνύουν τη Bayesian ANOVA ως μια πιο ευέλικτη και πληροφοριακά πλουσιότερη προσέγγιση στην ανάλυση διακύμανσης, η οποία αντιμετωπίζει τη διόρθωση πολυπλοκότητας εγγενώς, χωρίς την ανάγκη αυθαίρετων προσαρμογών. Με τη βελτίωση της επιλογής μοντέλου και τον περιορισμό του κινδύνου ψευδών ανακαλύψεων, η Bayesian προσέγγιση καθίσταται μια ισχυρή εναλλακτική των κλασικών μεθόδων, ενισχύοντας την υιοθέτηση Μπεϋζιανών τεχνικών στη στατιστική ανάλυση και την εφαρμοσμένη έρευνα.
  • Τεκμήριο
    Credit rating and migration modelling
    (2025-04-02) Κοντογιάννης, Γεράσιμος; Βακερούδης, Σταύρος; Ζυμπίδης, Αλέξανδρος; Γιαννακόπουλος, Αθανάσιος
    Η εργασία αυτή αποτελεί μία προσπάθεια να απαντήσουμε σε ερωτήματα που έχουν απασχολήσει στο παρελθόν (ή και απασχολούν ακόμη) όσους ενασχολούνται με την εκτίμηση της πιστοληπτικής ικανότητας επιχειρήσεων:  Πώς μπορούμε να εκτιμήσουμε την πιθανότητα μία επιχείρηση να μην δύναται να εξυπηρετήσει τις υποχρεώσεις της στο άμεσο ή και στο μακρινό μέλλον;  Τα οικονομικά μεγέθη ενός ισολογισμού λένε πάντα την αλήθεια;  Είναι ικανός ο ισολογισμός μίας χρονιάς να μας προετοιμάσει για το τι θα συμβεί την «επόμενη μέρα»; Εάν ναι, βάσει ποιων στοιχείων μπορεί να γίνει αυτό;  Είναι κάποια από τα οικονομικά στοιχεία σημαντικότερα από κάποια άλλα; Στα παραπάνω ερωτήματα θα επιχειρήσουμε να απαντήσουμε κάνοντας χρήση μεθόδων clustering, logistic regression models και πινάκων πιθανοτήτων μετάβασης. Θα βασιστούμε σε στοιχεία δημοσιευμένων ισολογισμών 180 επιχειρήσεων, οι οποίες εδρεύουν στην Ευρώπη, σε συνδυασμό με εκτιμήσεις Εταιρείας η οποία εκτιμά την πιστοληπτική ικανότητα αυτών των επιχειρήσεων. Μέσω μεθόδων Clustering θα επιχειρήσουμε να δούμε εάν προκύπτουν συσχετίσεις μέσα από τα στοιχεία ενός ισολογισμού και εάν ομαδοποιώντας κάποια στοιχεία θα έχουμε κάποιο υποσύνολο μεταβλητών που αξίζει να αναλύσουμε περαιτέρω. Έχοντας μία πρώτη εικόνα από την παραπάνω διαδικασία, θα συνεχίσουμε την ανάλυση με χρήση Logistic Regression Models. Εκεί θα διαπιστώσουμε εάν υπάρχουν κάποια στοιχεία τα οποία είναι πιο σημαντικά από άλλα στην προσπάθεια κατηγοριοποίησης μίας επιχείρησης σε κάποιο rating class. Θα μπορέσουμε επίσης να δούμε ποιοι είναι οι συντελεστές εκείνοι που θα μας δίνανε σε ένα μοντέλο τη δυνατότητα εκτίμησης, ίσως και πρόβλεψης του rating. Τέλος με τη χρήση των πινάκων πιθανοτήτων μετάβασης, θα μπορέσουμε να διαπιστώσουμε εάν η γνωστή μεταβολή στο rating μιας επιχείρησης για ένα οικονομικό έτος είναι ικανή να προβλέψει τι θα συμβεί στο μέλλον, στην επόμενη οικονομική περίοδο ή ακόμα και σε βάθος ετών. Σε αυτή τη διαδικασία θα βασιστούμε στη θεωρία των Μαρκοβιανών Αλυσίδων. Όλες οι παραπάνω διαδικασίες θα υλοποιηθούν με το στατιστικό πρόγραμμα “R”.
  • Τεκμήριο
    Microarray data analysis
    (2025-03-13) Κασιάν-Παναγιωτοπούλου, Αλίνα; Kasian-Panagiotopoulou, Alina; Demiris, Nikolaos; Pedeli, Xanthi; Papastamoulis, Panagiotis
    Η τεχνολογία μικροσυστοιχιών έχει φέρει επανάσταση στον τομέα της γονιδιωματικής, επιτρέποντας την ποσοτική μέτρηση των επιπέδων έκφρασης χιλιάδων γονιδίων σε ένα μόνο πείραμα. Αυτή η τεχνολογία υψηλής διαπερατότητας υπήρξε καθοριστική για την κατανόηση βιολογικών διεργασιών, την αναγνώριση βιοδεικτών για ασθένειες και τη μελέτη μοριακών μονοπατιών πολλών καταστάσεων. Ωστόσο, η ανάλυση δεδομένων μικροσυστοιχιών, αν και εξαιρετικά ισχυρή, συνοδεύεται από σοβαρά στατιστικά προβλήματα λόγω της υψηλής διάστασης των δεδομένων, της εγγενούς μεταβλητότητας και της ανάγκης για ανθεκτικές μεθόδους που να μπορούν να εξάγουν ουσιαστικές βιολογικές πληροφορίες. Μία από τις σημαντικότερες προκλήσεις στην ανάλυση δεδομένων μικροσυστοιχιών είναι αυτή των πολλαπλών υποθέσεων. Με χιλιάδες γονίδια να εξετάζονται ταυτόχρονα για διαφορική έκφραση, η εφαρμογή παραδοσιακών στατιστικών μεθόδων οδηγεί σε αύξηση των ψευδώς θετικών ευρημάτων, γεγονός που καθιστά αναγκαία τη χρήση διορθώσεων που εξισορροπούν το πλήθος των ψευδών ανακαλύψεων με τη στατιστική ισχύ. Η προσέγγιση του Ρυθμού Ψευδών Ανακαλύψεων (False Discovery Rate - FDR) των Benjamini και Hochberg (1995) αποτελεί μία από τις πιο διαδεδομένες μεθόδους για τη ρύθμιση των ψευδών θετικών αποτελεσμάτων και την επίτευξη υψηλής ευαισθησίας. Στην παρούσα διπλωματική εργασία εξετάζονται διάφορες μέθοδοι ελέγχου πολλαπλών υποθέσεων, από τις ιδιαίτερα συντηρητικές παραδοσιακές προσεγγίσεις όπως η διόρθωση Bonferroni έως τις πλέον σύγχρονες και εξελιγμένες στρατηγικές βασισμένες στο FDR, και αξιολογείται η εφαρμογή τους σε δεδομένα μικροσυστοιχιών. Ένα ακόμη κεντρικό ζήτημα στην ανάλυση μικροσυστοιχιών αποτελεί η αναγνώριση διαφορετικά εκφραζόμενων γονιδίων (Differentially Expressed – DE). Το πακέτο limma, το οποίο βασίζεται σε γραμμικά μοντέλα και εμπειρική εξομάλυνση της διασποράς μέσω Bayes, έχει καθιερωθεί ως πρότυπο για την ανίχνευση διαφορικής έκφρασης σε μελέτες μικροσυστοιχιών. Στην παρούσα εργασία, το limma συγκρίνεται με τα παραδοσιακά t-tests και η απόδοσή τους αξιολογείται υπό διάφορες συνθήκες, όπως διαφορετικά μεγέθη επίδρασης, δείγματος και επίπεδα θορύβου. Μέσω διαφορετικών σεναρίων προσομοίωσης και εφαρμογής των μεθόδων σε πραγματικά δεδομένα μικροσυστοιχιών, αναδεικνύονται τα πλεονεκτήματα των εμπειρικών μεθόδων Bayes όσον αφορά τη μείωση της αβεβαιότητας στην εκτίμηση της διασποράς και την αύξηση της στατιστικής ισχύος. Πέρα από την ανάλυση διαφορικής έκφρασης, το clustering παίζει καθοριστικό ρόλο στην αναγνώριση προτύπων στα γονιδιακά δεδομένα έκφρασης. Οι παραδοσιακές μέθοδοι, όπως hierachical clustering και το k-means, χρησιμοποιούνται ευρέως αλλά παρουσιάζουν σημαντικούς περιορισμούς, όπως ευαισθησία στο θόρυβο και αδυναμία προσδιορισμού του βέλτιστου αριθμού clusters. Για την αντιμετώπιση αυτών των προκλήσεων, χρησιμοποιούνται μεθοδολογίες βασισμένες σε μοντέλα όπως τα Gaussian Mixture Models - GMMs και προχωρημένες Bayesian προσεγγίσεις όπως το PUMA-CLUST, οι οποίες προσφέρουν ένα μαθηματικό πλαίσιο για την ανάλυση clusters σε δεδομένα μικροσυστοιχιών. Στην εργασία αυτή εξετάζονται διάφορες τεχνικές clustering, αξιολογείται η απόδοσή τους υπό διαφορετικές συνθήκες και αναδεικνύεται η συμβολή των πιθανοθεωρητικών μοντέλων στη βελτίωση της σταθερότητας και της ερμηνευσιμότητας των clusters. Συνολικά, η εργασία παρουσιάζει μία εκτενή επισκόπηση στατιστικών και υπολογιστικών μεθόδων για την ανάλυση δεδομένων μικροσυστοιχιών, καλύπτοντας τις θεματικές των πολλαπλών υποθέσεων, της διαφορικής έκφρασης και του clustering. Μέσα από τον συνδυασμό θεωρίας και εφαρμογής, αποσαφηνίζονται τα πλεονεκτήματα και οι περιορισμοί κάθε μεθόδου, προσφέροντας ένα δομημένο πλαίσιο για την ανάλυση υψηλής διάστασης γονιδιακών εκφράσεων. Τα συμπεράσματα της εργασίας συμβάλλουν στην ανάπτυξη πιο αξιόπιστων και ισχυρών μεθοδολογιών για την εξαγωγή βιολογικά ερμηνεύσιμων πληροφοριών από πειράματα μικροσυστοιχιών.
  • Τεκμήριο
    Εγκυρότητα και αξιοπιστία των ψηφιακών βιοδεικτών για τη μετωποκροταφική άνοια
    (2025-03-27) Stylidis, Ioannis; Στυλίδης, Ιωάννης; Kornak, John; Spelta, Alessandro; Ntzoufras, Ioannis
    Η μετωποκροταφική άνοια είναι μια νευρολογική πάθηση που απασχολεί την ανθρωπότητα για μεγάλο χρονικό διάστημα. Οι ασθενείς με αυτή την πάθηση υποφέρουν από διάφορες συνέπειες, όπως γνωστική δυσλειτουργία, κινητικά προβλήματα και συναισθηματική αναστάτωση. Δυστυχώς, δεν υπάρχει μόνιμη θεραπεία για αυτήν. Επομένως, η αναζήτηση τρόπων για τη συλλογή περισσότερων δεδομένων θα ήταν εξαιρετικά χρήσιμη στην αντιμετώπιση αυτού του προβλήματος. Ως απάντηση, έχει αναπτυχθεί μια εφαρμογή κινητού (ALLFTDMobileApp), η οποία έχει ως στόχο να προσομοιώσει τα δεδομένα που συλλέγονται από διαγνωστικά τεστ. Αυτή η εφαρμογή περιλαμβάνει παιχνίδια κινητού σχεδιασμένα για να αξιολογούν τη γνωστική λειτουργία των ασθενών, τα οποία μπορεί να παρέχουν πληροφορίες για το επίπεδο της άνοιας στους ασθενείς. Συλλέγοντας περισσότερα δεδομένα από τους ασθενείς, η εφαρμογή αυτή διευκολύνει τις ερευνητικές προσπάθειες που αποσκοπούν στην εύρεση θεραπείας και στην καλύτερη πρόβλεψη της σοβαρότητας της νόσου στους ασθενείς. Στην ανάλυσή μας, θα αποδείξουμε ότι αυτή η εφαρμογή κινητού έχει τη δυνατότητα να αντικαταστήσει ορισμένα διαγνωστικά τεστ που συνήθως πραγματοποιούνται στα νοσοκομεία, επιτρέποντας στους ασθενείς να υποβληθούν σε λιγότερες διαδικασίες. Αυτό θα επιτευχθεί χρησιμοποιώντας δεδομένα από τις επιδόσεις των παιχνιδιών με την πάροδο του χρόνου από τους συμμετέχοντες και αξιολογώντας τη συσχέτισή τους με διαγνωστικά τεστ, όπως οι όγκοι περιοχών του εγκεφάλου από εγκεφαλικές απεικονίσεις. Στη μελέτη αυτή, θα χρησιμοποιηθούν δύο τεχνικές — Μοντέλα Μικτών Επιδράσεων και Μοντελοποίηση Δομικών Εξισώσεων — για να αναλυθεί η σχέση μεταξύ των επιδόσεων στα παιχνίδια και των όγκων του εγκεφάλου
  • Τεκμήριο
    Stochastic differential equations
    (2025-03-26) Tarasenko, Yulia; Zazanis, Michael; Yannacopoulos, Athanasios; Vakeroudis, Stavros
    Stochastic differential equations serve as the foundation for many sections of applied sciences, such as mechanics, statistical physics, diffusion theory, cosmology, financial mathematics, economics, etc. The number of works devoted to various issues related to specific equations considered in individual areas of science listed above is very large. In this study, we consider only the general theory of stochastic differential equations, which is based on the approach initiated by K. Itô. In addition, we discuss simple analytical and numerical methods for solving such equations and, finally, we present an application in finance, namely, the Black and Scholes option price formula. In Chapter 1 we introduce basic notations and facts from the theory of stochastic processes, needed for the concept of Itô integrals in Chapter 2. In Section 1.2 we present the concept and some properties of Brownian motion which is one of the fundamental processes in mathematics and physics, as well as in natural science in general. In Chapter 2 we develop the Itô stochastic calculus, which has important applications in mathematical finance and stochastic differential equations. The theory of stochastic integration with respect to Brownian motion is developed in Section 2.1. In Section 2.2 we present the chain rule for stochastic calculus, commonly known, as the Itô formula. Chapter 3 returns to our main theme of stochastic differential equations. In this chapter, we present the stochastic differential equations, driven by Brownian motion, and the notions of strong and weak solutions. Section 3.1 is devoted to the theorem on the existence and uniqueness of a solution to a stochastic differential equation. In Section 3.2 we introduce the concept of a weak solution and the method for constructing such solutions by the Girsanov theorem. In Section 3.3 we give examples of stochastic differential equations and some analytical methods for solving them. In Section 3.4 we discuss two most popular numerical methods for solving (or simulating from) stochastic differential equations: the Euler-Maruyama method and the Milstein method. In Chapter 4 we introduce the necessary concepts from finance, and, finally, we present a proof of the Black-Scholes formula, which gives a theoretical estimate of the price of European-style options. Chapter 5 highlights areas for further research and perspectives.
  • Τεκμήριο
    Προβλεψιμότητα της κατεύθυνσης των τιμών χρηματιστηριακών δεικτών με τη χρήση μεθόδων μηχανικής μάθησης
    Νίκας, Παναγιώτης; Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Στατιστικής; Ψαράκης, Στυλιανός; Λειβαδά, Αλεξάνδρα; Βρόντος, Ιωάννης
    Η παρούσα μελέτη εξετάζει την ύπαρξη προβλεψιμότητας της κατεύθυνσης των ημερήσιων τιμών τριών χρηματιστηριακών δεικτών (S&P500, Dow Jones και Nasdaq) με τη χρήση μεθόδων Μηχανικής Μάθησης. Για τον σκοπό αυτό, χρησιμοποιούνται οι τιμές κλεισίματος των δεικτών για τα έτη 2001-2021, από τις οποίες υπολογίζονται τεχνικοί δείκτες που λειτουργούν ως επεξηγηματικές μεταβλητές για την εκτίμηση των μελλοντικών τιμών των δεικτών. Τα δεδομένα χωρίζονται σε δύο υποομάδες (training και test dataset), ενώ η πρόβλεψη των τιμών πραγματοποιείται με τη χρήση 16 μεθόδων Μηχανικής Μάθησης. Τα αποτελέσματα δείχνουν ότι υφίσταται προβλεψιμότητα των κατευθύνσεων των τιμών των δεικτών, ωστόσο σε χαμηλά επίπεδα. Καλύτερες μέθοδοι για το πρόβλημά μας αποδείχθηκαν οι ANN, οι τεχνικές Boosting, SVM και Conditional Forest και φαίνεται να εμφανίζουν καλύτερες αποδόσεις από κλασικές στατιστικές τεχνικές, όπως η Λογιστική Παλινδρόμηση.