Λογότυπο αποθετηρίου
 

Μεταπτυχιακές Εργασίες

Μόνιμο URI για αυτήν τη συλλογήhttps://pyxida.aueb.gr/handle/123456789/15

Περιήγηση

Πρόσφατες Υποβολές

Τώρα δείχνει 1 - 20 από 1203
  • Τεκμήριο
    Equity return forecasting & portfolio optimization: a machine-learning approach
    (2025-10-07) Charalampi, Kleopatra; Χαραλάμπη, Κλεοπάτρα; Psarakis, Stelios; Besbeas, Panagiotis; Vrontos, Ioannis
    In today’s dynamic financial markets, investment portfolio management is of central focus in financial research. While the portfolio selection problem is highly contingent upon reliable prediction of the future performance of stock markets, accurate forecasting of stock returns remains a great challenge to both academics and practitioners. This thesis investigates the application of machine learning (ML) and deep learning (DL) models in forecasting stock returns and constructing optimized equity portfolios. Using a subset of 25 highly liquid S&P 500 stocks, the study evaluates the predictive accuracy of Ridge Regression, eXtreme Gradient Boosting (XGBoost) and Long Short-Term Memory (LSTM). Forecasted returns are subsequently integrated into a mean-variance optimization model to select and allocate capital among the top-performing stocks at each rebalancing date. Empirical results support the superiority of advanced ML and DL models in stock return forecasting, compared to traditional penalized regression approaches, and demonstrate large economic gains to investors that incorporate them into their investment strategies.
  • Τεκμήριο
    Development and comparison of fetal growth reference curves
    (2025-09-22) Plithaki, Natasa; Πληθάκη, Αναστασία; Ntzoufras, Ioannis; Besbeas, Panagiotis; Pateras, Konstantinos
    Η ακριβής εκτίμηση της εμβρυϊκής ανάπτυξης αποτελεί θεμελιώδη παράγοντα της προγεννητικής φροντίδας, καθώς επιτρέπει την έγκαιρη ανίχνευση ανωμαλιών στην ανάπτυξη που ενδέχεται να έχουν σημαντικές κλινικές συνέπειες. Αν και οι καμπύλες αναφοράς χρησιμοποιούνται ευρέως, διαφέρουν μεταξύ πληθυσμών και συχνά βασίζονται σε περιορισμένες στατιστικές μεθόδους, οι οποίες δεν αποτυπώνουν πλήρως την πολυπλοκότητα της εμβρυϊκής ανάπτυξης. Η παρούσα διατριβή επικεντρώνεται στην ανάπτυξη και σύγκριση καμπυλών αναφοράς εμβρυϊκής ανάπτυξης, αξιοποιώντας πραγματικά δεδομένα υπερηχογραφικών μετρήσεων από ελληνικές κλινικές, με στόχο τη δημιουργία προτύπων που αντικατοπτρίζουν τα χαρακτηριστικά του ελληνικού πληθυσμού. Αρχικά, παρουσιάζεται η ιστορική εξέλιξη και η χρήση των καμπυλών ανάπτυξης στην ιατρική πράξη, ενώ ακολουθεί συγκριτική ανάλυση διαφόρων στατιστικών προσεγγίσεων, όπως η γραμμική παλινδρόμηση, τα γενικευμένα γραμμικά μοντέλα και τα γενικευμένα προσαρμοστικά μοντέλα (GAMs). Βασιζόμενη σε αυτά, η εργασία εφαρμόζει τα γενικευμένα προσαρμοστικά μοντέλα για θέση, κλίμακα και μορφή (GAMLSS) — ένα ευέλικτο πλαίσιο που επιτρέπει τη μοντελοποίηση όχι μόνο του μέσου όρου, αλλά τεσσάρων παραμέτρων. Χρησιμοποιώντας ένα καλά καθορισμένο δείγμα πληθυσμού, βασικές εμβρυϊκές παράμετροι όπως η διμερής διάμετρος του κρανίου, η περίμετρος κεφαλής, το μήκος του μηριαίου οστού, η περίμετρος κοιλιάς και το εκτιμώμενο βάρος εμβρύου μοντελοποιήθηκαν σε συνάρτηση με την ηλικία κύησης. Παράλληλα, εφαρμόστηκαν διαδικασίες εσωτερικής επικύρωσης για την αξιολόγηση της ακρίβειας και της αξιοπιστίας των παραγόμενων καμπυλών αναφοράς. Εκτός από τις στατικές καμπύλες εκατοστημορίων, η διατριβή αναπτύσσει και μοντέλα ταχύτητας ανάπτυξης, προσφέροντας μια δυναμική προοπτική των προτύπων αύξησης. Παραδείγματα εφαρμογών καταδεικνύουν πώς οι καμπύλες ταχύτητας μπορούν να διαφοροποιούν μεταξύ φυσιολογικής, επιταχυμένης και περιορισμένης ανάπτυξης, παρέχοντας χρήσιμες κλινικές πληροφορίες. Η εφαρμογή προχωρημένων στατιστικών μεθόδων, όπως το GAMLSS, σε πραγματικά δεδομένα από την ελληνική κλινική πράξη, επέτρεψε την ανάπτυξη επικαιροποιημένων καμπυλών αναφοράς εμβρυϊκής ανάπτυξης που αντανακλούν με ακρίβεια τα χαρακτηριστικά του τοπικού πληθυσμού. Συνδυάζοντας την αξιολόγηση τόσο του μεγέθους όσο και της ταχύτητας ανάπτυξης, τα προτεινόμενα μοντέλα προσφέρουν μια πιο ολοκληρωμένη περιγραφή της εμβρυϊκής ανάπτυξης και ενισχύουν την ικανότητα εντοπισμού αποκλίσεων από την αναμενόμενη πορεία. Η εργασία συμβάλλει έτσι στη δημιουργία σύγχρονων και πληθυσμιακά αντιπροσωπευτικών προτύπων για τον ελληνικό πληθυσμό, παρέχοντας στους κλινικούς ιατρούς πιο αξιόπιστα εργαλεία για την προγεννητική παρακολούθηση και στην περαιτέρω βελτίωση των οδηγιών περιγεννητικής φροντίδας.
  • Τεκμήριο
    Modeling and forecasting construction material time series using dynamic panel data models
    (2025-10-08) Lazaros, Nikolaos-Ioannis; Λάζαρος, Νικόλαος-Ιωάννης; Besbeas, Panagiotis; Psarakis, Stelios; Vrontos, Ioannis
    This thesis investigates the modeling and forecasting of U.S. cement import using dynamic econometric methods, focusing on short- and long-term trends over four central states: California, Florida, North Carolina, and Texas. Our interest stems from the fact that construction materials have always played a critical role in infrastructure planning, while their prices have been characterized by considerable volatility. Our approach is based on the construction of a panel dataset covering the period 2008–2022 and the use of time series and panel data techniques. The use of import volume instead of prices is chosen in this case due to address data availability issues. Besides, imports dynamics reflect the fluctuations of construction activity and, therefore, those of domestic demand and prices of materials. After transforming the data to ensure stationarity, Lasso regression is used for the selection of state-specific predictors. These variables are incorporated into ARIMAX models to improve forecasting performance. We evaluate each model’s predictive ability using metrics such as RMSE, MAE, and Mean Error, with ARIMAX generally producing strong results, particularly in California and Texas. In addition, a number of panel modeling approaches, including Pooled OLS, Fixed Effects, and Seemingly Unrelated Regressions (SUR) are explored. While these models offer interpretive insights, their predictive performance varies across states, with the SUR model examined primarily as an exploratory framework for capturing potential cross-sectional dependencies. The results highlight the effectiveness of combining variable selection and ARIMA modeling for state-level forecasting of construction imports. They also emphasize the importance of adapting model structures to regional characteristics and data behavior, offering guidance for both practitioners and policymakers in the construction and economic planning sectors.
  • Τεκμήριο
    Πρόβλεψη φορτίου και τιμών ηλεκτρικής ενέργειας
    (2025-10-07) Κοτοπούλη, Ευαγγελία; Kotopouli, Evangelia; Μπεσμπέας, Παναγιώτης; Ψαράκης, Στέλιος; Βρόντος, Ιωάννης
    Η παρούσα εργασία με τίτλο «Πρόβλεψη Φορτίου και Τιμών Ηλεκτρικής Ενέργειας» αναλύει την ανάπτυξη μοντέλων πρόβλεψης για τη ζήτηση ηλεκτρικής ενέργειας και τις τιμές της στην προημερήσια αγορά (DAM). Η μελέτη γίνεται για την ελληνική αγορά και την ευρωπαϊκή αγορά ηλεκτρικής ενεργειακής, εξετάζοντας τα χαρακτηριστικά των συστημάτων, τις διασυνοριακές διασυνδέσεις και το Euphemia, ως τον κύριο αλγόριθμο που χρησιμοποιείται στις ευρωπαϊκές αγορές ενέργειας. Εφαρμόζονται στατιστικές μέθοδοι και μοντέλα μηχανικής εκμάθησης, όπως γραμμική παλινδρόμηση, XGBoost, Temporal Convolutional Networks (TCN) και υβριδικές προσεγγίσεις, για την εξαγωγή προβλέψεων φορτίου και τιμών με στόχο τη βελτίωση της ακρίβειας και αξιοπιστίας. Η εργασία περιλαμβάνει λεπτομερή ανάλυση των δεδομένων της ελληνικής αγοράς, τη διαμόρφωση χαρακτηριστικών και τη σύγκριση των μοντέλων πρόβλεψης. Παρουσιάζονται αποτελέσματα που δείχνουν τις δυνατότητες και τα όρια κάθε μοντέλου, ξεχωρίζοντας τις μεθόδους που προσφέρουν την καλύτερη απόδοση για διαφορετικά χρονικά διαστήματα και τύπους δεδομένων. Ο συνδυασμός σύγχρονων αλγορίθμων και η ενσωμάτωση μεταβλητών μετεωρολογικών και λειτουργικών παραγόντων αποδεικνύεται ιδιαίτερα αποτελεσματικός για την αναπτυσσόμενη ενεργειακή αγορά της Ελλάδας και τη βελτίωση της διαχείρισης κινδύνων στην αγορά της ηλεκτρικής ενέργειας.
  • Τεκμήριο
    Polling misses - causes and treatment
    (2025-09-26) Nikolaidou, Marina-Nektaria; Νικολαΐδου, Μαρίνα-Νεκταρία; Psarakis, Stelios; Chasiotis, Vasileios; Papageorgiou, Ioulia
    This thesis analyses the phenomenon of polling misses, mentioning the causes that led to them and proposing treatments to address them. Starting with a general into about polling, moving on to a historical overview and highlighting methodological developments and key failures over time. The second part is referring to the main causes of developing those misses and general errors in the polling process, including sampling bias, nonresponse, turnout misestimation, question design, weighting inaccuracies and the hearding. Then methods of treatment are taken down just to insert into the process and improve it, such as improved sampling techniques, adjustments for nonresponse, model-based turnout estimations, refining question design and proper weighting techniques and others. Lastly the practical part involves simulations on a synthetic population reflecting the Greek demographic structure when it comes to age characteristics, where different sample sizes and nonresponse scenarios are tested to see their performance in estimate vote percentages with or without any adjustments like, complete case (estimates with only the available information) and imputation and reweighting methods (where the nonresponse is “treat” it ).
  • Τεκμήριο
    Mediation analysis for high dimensional data
    (2025-09-26) Bushi, Enisa; Μπούσι, Ενίσα; Demiris, Nikolaos; Pateras, Konstantinos; Papageorgiou, Ioulia
    This study explores how breakfast dietary patterns influence the relationship between high blood pressure (hypertension) and the progression of artery plaque over five years in a group of 115 Greek adults. The research used a big dataset with variables related to diet and vascular health. Using exploratory factor analysis on 20 breakfast items, research identified two main dietary patterns: the Processed–Carb pattern (high in refined cereals, sugars, margarine, and tea) and the Fruit–Protein pattern (rich in fruits, cheese, and eggs). These patterns were studied to see how they affected plaque progression, while hypertension served as the covariate influencing the outcome (plaque progression). Results showed that the Fruit–Protein pattern helped prevent plaque from getting worse, while the Processed–Carb pattern made it more likely to get worse. When considering dietary patterns, the direct impact of persistent hypertension on plaque progression was not significant. However, both breakfast patterns showed a positive relationship where hypertension indirectly influenced plaque progression through diet. Overall, the study suggests that specific breakfast choices can mediate the effects of hypertension persistence on artery plaque development, with healthy fruit and protein-rich breakfasts connected to less progression and those high in processed food associated with increased progression.
  • Τεκμήριο
    A comparative study of traditional and machine learning methods for forecasting time series data
    (2025-09-16) Kataki, Christina; Κατάκη, Χριστίνα; Karlis, Dimitrios; Ioannidis, Evangelos; Pedeli, Xanthi
    Η δυνατότητα πρόβλεψης μελλοντικών τάσεων με βάση τα ιστορικά δεδομένα αποτελεί κρίσιμο παράγοντα σε πολλούς τομείς όπως η οικονομία, τα χρηματοοικονομικά, η επιχειρησιακή διαχείριση και το μάρκετινγκ. Για δεκαετίες, τα παραδοσιακά στατιστικά μοντέλα, όπως το μοντέλο εκθετικής εξομάλυνσης ETS (σφάλμα–τάση–εποχικότητα) και το αυτοπαλινδρομικό μοντέλο κινητού μέσου όρου (ARIMA), υπήρξαν τα κυρίαρχα εργαλεία στην πρόβλεψη χρονοσειρών. Η ευρεία χρήση τους οφείλεται στην αξιοπιστία, την απλότητα και την ικανότητά τους να παρέχουν ακριβείς εκτιμήσεις για πληθώρα διαφορετικών τύπων δεδομένων. Ωστόσο, η ραγδαία αύξηση της διαθεσιμότητας και του όγκου των δεδομένων έχει οδηγήσει στην υιοθέτηση προηγμένων τεχνικών μηχανικής μάθησης, οι οποίες πλέον ανταγωνίζονται άμεσα τις παραδοσιακές μεθόδους. Τεχνικές όπως τα επαναλαμβανόμενα νευρωνικά δίκτυα (RNNs) προσφέρουν μη γραμμική μοντελοποίηση, επιτρέποντάς τους να συλλάβουν πολύπλοκα πρότυπα και λεπτομέρειες που μπορεί να διαφύγουν από τα παραδοσιακά στατιστικά μοντέλα. Παρά την αυξανόμενη προσοχή και τις υποσχέσεις που παρουσιάζουν οι μέθοδοι μηχανικής μάθησης, εξακολουθεί να υπάρχει σημαντικό κενό σε άμεσες συγκρίσεις μεταξύ αυτών των τεχνικών και των παραδοσιακών στατιστικών προσεγγίσεων, ιδίως όσον αφορά την ακρίβεια πρόβλεψης και τις υπολογιστικές απαιτήσεις. Αν και η μηχανική μάθηση έχει μεγάλες δυνατότητες, δεν είναι πάντα προφανές εάν μπορεί να υπερτερεί σταθερά των παραδοσιακών μεθόδων, ειδικά σε πρακτικά σενάρια όπου τόσο η ακρίβεια όσο και η αποδοτικότητα είναι απαραίτητες. Με τη σύγκριση της απόδοσης πρόβλεψης παραδοσιακών στατιστικών μοντέλων με διάφορες τεχνικές μηχανικής μάθησης, ο στόχος είναι να διαπιστωθεί πότε και γιατί μία προσέγγιση μπορεί να είναι πιο αποτελεσματική από την άλλη. Η έμφαση δίνεται όχι μόνο στην ακρίβεια των προβλέψεων αλλά και στο υπολογιστικό κόστος αυτών των μεθόδων. Τελικά, θα παρουσιαστεί μία συγκριτική ανάλυση των δυνατών και αδύνατων σημείων τόσο των παραδοσιακών στατιστικών μεθόδων όσο και των τεχνικών μηχανικής μάθησης.
  • Τεκμήριο
    From traditional univariate to multivariate capability indices: recent developments and applications
    (2025-09-29) Papafotiou, Effimia; Παπαφωτίου, Ευφημία; Vrontos, Ioannis; Yannacopoulos, Athanasios; Psarakis, Stelios
    Οι Δείκτες Ικανότητας Διεργασιών (PCIs) διαδραματίζουν εξαιρετικά σημαντικό ρόλο στη διαχείριση ποιότητας, καθώς προσφέρουν ένα ποσοτικό μέτρο της ικανότητας της διεργασίας να παράγει αποτελέσματα εντός των επιτρεπτών, καθορισμένων ορίων. Οι κλασικοί δείκτεσ δείκτες, όπως οι Cp, Cpk, και Cpm, αποτελούν τους πιο γνωστούς και ευρέως χρησιμοποιούμενους. Η παρούσα διατριβή εξετάζει τις θεωρητικές βάσεις των Δεικτών Ικανότητας Διεργασιών, παρουσιάζει τις παραδοχές και τους περιορισμούς τους και διερευνά μονομεταβλητές και πολυμεταβλητές προσεγγίσεις. Επιπλέον, η έρευνα περιλαμβάνει Ασαφείς (Fuzzy) και Ανθετικές (Robust) μεθόδους. Ακουλούθως, πραγματοποιούνται εφαρμογές σε μονομεταβλητές και πολυμεταβλητές περιπτώσεις, συμπεριλαμβανομένων δύο μονομεταβλητών και μίας πολυμεταβλητής εφαρμογής στο προγραμματιστικό λογισμικό της R. Συγκεκριμένα, πραγματοποιήθηκε μία μελέτη στον φαρμακευτικό τομέα, ενώ στη συνέχερια εφαρμόστηκαν Ασαφείς Δείκτες Ικανότητας στη παρακολούθηση ποιότητας αέρα. Παράλληλα, υλοποιήθηκε μία ακόμη μελέτη στον τομέα της μηχανικής χρησιμοποιώντας πολυμεταβλητούς δείκτες ικανότητας βασισμένους στην Ανάλυση Κύριων Συνιστωσών (PCA-based). Τα παραδείγματα αυτά αναδεικνύουν τη σημασία των Δεικτών Ικανότητας Διεργασιών στην πράξη, καθώς και τον καθοριστικό ρόλο του στατιστικού λογισμικού στην αξιολόγηση της ικανότητας. Τέλος, η διατριβή συζητά για τις πρόσφατες προκλήσεις και τις μελλοντικές κατευθύνσεις για την ανάπτυξη προσαρμοστικών μεθόδων κατάλληλων για σύγχρονα περιβάλλοντα παραγωγής.
  • Τεκμήριο
    Στατιστικός  έλεγχος διεργασιών στο πόσιμο νερό
    (2025-09-30) Λασκαρίδης, Κωνσταντίνος; Γιαννακόπουλος, Αθανάσιος; Βακερούδης, Σταύρος; Ψαράκης, Στυλιανός
    Η παρούσα διπλωματική εργασία ασχολείται με τον ποιοτικό έλεγχο του πόσιμου νερού, εστιάζοντας σε δύο βασικές παραμέτρους: το pH και το ενεργό χλώριο. Οι μεταβλητές αυτές επιλέχθηκαν καθώς αποτελούν κρίσιμους δείκτες της ποιότητας και της ασφάλειας του νερού, τόσο σε μικροβιολογικό όσο και σε χημικό επίπεδο. Τα δεδομένα που χρησιμοποιήθηκαν αντλήθηκαν από προηγούμενη μελέτη, στην οποία είχε πραγματοποιηθεί δειγματοληψία και καταγραφή των τιμών των συγκεκριμένων παραμέτρων. Στο πλαίσιο της παρούσας εργασίας, τα δεδομένα αυτά επεξεργάστηκαν και αναλύθηκαν μέσω του στατιστικού λογισμικού R, με στόχο την εξαγωγή αξιόπιστων συμπερασμάτων σχετικά με την κατανομή, τη διακύμανση και τις τάσεις που παρουσιάζουν οι μεταβλητές. Η ανάλυση επικεντρώθηκε σε περιγραφικά στατιστικά, ελέγχους ποιότητας και γραφικές απεικονίσεις, προκειμένου να εκτιμηθεί η συμμόρφωση των μετρήσεων με τα αποδεκτά όρια που ορίζονται από την ισχύουσα νομοθεσία για το πόσιμο νερό. Τα αποτελέσματα ανέδειξαν κρίσιμα σημεία σχετικά με τη σταθερότητα του pH και τα επίπεδα του ενεργού χλωρίου, στοιχεία που συμβάλλουν στην ασφάλεια του υδάτινου δικτύου και στην προστασία της δημόσιας υγείας. Η εργασία καταλήγει σε προτάσεις για περαιτέρω συστηματική παρακολούθηση και αξιοποίηση στατιστικών εργαλείων, με στόχο τη βελτίωση των διαδικασιών ποιοτικού ελέγχου του πόσιμου νερού και την ενίσχυση της αξιοπιστίας των σχετικών μετρήσεων.
  • Τεκμήριο
    Long-run evaluation and modifications of Bayesian control charts for normal data
    (2025-09-24) Polytsiaris, Michalis; Πολυτσιάρης, Μιχάλης; Ntzoufras, Ioannis; Psarakis, Stelios; Tsiamyrtzis, Panagiotis
    Σε αυτή τη διατριβή επεκτείνουμε την έρευνα πάνω στα Predictive Control Chart (PCC) και το Predictive Ratio CUSUM (PRC), δύο μεθόδους που εντάσσονται στο ευρύτερο πλαίσιο του Μπεϋζιανού Στατιστικού Ελέγχου και Παρακολούθησης Διεργασιών (SPC/M). Το PCC αξιοποιεί την εκ των προτέρων πληροφορία και τα ιστορικά δεδομένα μέσω power priors, παρέχοντας ένα πρώιμο πλεονέκτημα στην επιτήρηση σε πραγματικό χρόνο και εξειδικεύεται στην ανίχνευση ακραίων τιμών, χωρίς να απαιτούνται υπολογισμοί για το Phase I. Από την άλλη πλευρά, το PRC στηρίζεται σε παρόμοιο πλαίσιο, αλλά έχει σχεδιαστεί ώστε να ανιχνεύει μικρές έως μεσαίες επίμονες μετατοπίσεις παραμέτρων. Η παρούσα εργασία επικεντρώνεται στην περίπτωση όπου τα δεδομένα ακολουθούν κανονική κατανομή. Υπάρχει διπλός στόχος: πρώτον, να παρασχεθεί μια μακροχρόνια αξιολόγηση του PCC και του PRC σε σενάρια εντός ελέγχου (IC) και εκτός ελέγχου (OOC). Δεύτερον, να προταθούν διάφορες τροποποιήσεις του PCC με σκοπό να βελτιωθεί δυνητικά η απόδοσή του σε μακροχρόνιες χρήσεις. Οι τροποποιημένες εκδοχές δοκιμάζονται μέσω προσομοιώσεων έναντι του αρχικού PCC, με ιδιαίτερη έμφαση στην αποτελεσματικότητα και τα διακριτά χαρακτηριστικά τους.
  • Τεκμήριο
    Determinants of bank profitability: evidence from large U.S. bank holding companies during 2021-2024
    (2025-09-15) Agatsas, Alexandros; Αγάτσας, Αλέξανδρος; Rompolis, Leonidas; Tsekrekos, Andrianos; Episcopos, Athanasios
    Αυτή η έρευνα εξετάζει παράγοντες που επηρεάζουν την κερδοφορία μεγάλων τραπεζικών εταιρειών συμμετοχών (bank holding companies) των Ηνωμένων Πολιτειών από το 2021 έως το 2024, κατά τη διάρκεια μιας περιόδου αναταραχής στις αγορές που χαρακτηρίζεται από τις επιπτώσεις της πανδημίας, τις γεωπολιτικές εντάσεις, τον πληθωρισμό και την άνοδο των επιτοκίων. Χρησιμοποιώντας ένα πάνελ σαράντα εννέα Bank Holding Companies (BHCs), βασισμένο στις καταστάσεις FR Y-9C του τέταρτου τριμήνου, η κερδοφορία μετράται μέσω της Απόδοσης Ενεργητικού (Return on Assets - ROA), της Απόδοσης Ιδίων Κεφαλαίων (Return on Equity - ROE) και του Καθαρού Περιθωρίου Τόκων (Net Interest Margin - NIM). Βασικοί προσδιοριστικοί παράγοντες περιλαμβάνουν το μέγεθος, τα ίδια κεφάλαια, την ένταση δανείων, τις καταθέσεις και τις προβλέψεις για ζημίες δανείων. Χρησιμοποιούνται εκτιμητές δεδομένων πάνελ, οι οποίοι επιλέγονται μέσω διαγνωστικών ελέγχων. Τα αποτελέσματα δείχνουν ότι το μέγεθος και η κεφαλαιοποίηση στερούνται συνεπούς σημαντικότητας, κάτι που ευθυγραμμίζεται με τα προφίλ μεγάλων, καλά κεφαλαιοποιημένων BHCs. Η ένταση δανείων συσχετίζεται ισχυρά με το NIM αλλά όχι με το ROA ή το ROE. Η υψηλότερη εξάρτηση από καταθέσεις μειώνει το ROA και το NIM, υποδεικνύοντας συμπίεση περιθωρίων εν μέσω ανταγωνισμού για καταθέσεις και μετακύλισης επιτοκίων. Οι προβλέψεις για ζημίες δανείων επηρεάζουν αρνητικά το ROA αλλά σχετίζονται θετικά με το NIM, αντανακλώντας την τιμολόγηση κινδύνου σε δάνεια υψηλού κινδύνου. Η μελέτη επεκτείνει το πλαίσιο των Menicucci-Paolucci (2016) στις Ηνωμένες Πολιτείες, αναδεικνύοντας τη σημασία της δυναμικής των καταθέσεων και της διαχείρισης πιστωτικού κινδύνου για τις ρυθμιστικές αρχές και τα τραπεζικά στελέχη που ισορροπούν μεταξύ ανάπτυξης, χρηματοδότησης και κινδύνου.
  • Τεκμήριο
    Credit risk and credit derivatives
    (2025-06-20) Μπότσι, Κωνσταντίν; Botsi, Kostas; Vakeroudis, Stavros; Zimpidis, Alexandros; Yannacopoulos, Athanasios
    Η διπλωματική εργασία με τίτλο «Πιστωτικός Κίνδυνος και Πιστωτικά Παράγωγα» εξετάζει τη σημασία, τη μέτρηση και τη διαχείριση του πιστωτικού κινδύνου, ο οποίος αποτελεί βασικό παράγοντα σταθερότητας και κερδοφορίας των χρηματοπιστωτικών ιδρυμάτων. Αρχικά αναλύονται οι θεμελιώδεις έννοιες, όπως η αναμενόμενη ζημία (Expected Loss), η ζημία λόγω αθέτησης (LGD), η έκθεση σε αθέτηση (EAD) και η απρόσμενη ζημία (Unexpected Loss), καθώς και η χρήση προχωρημένων μεθόδων όπως το μοντέλο CreditRisk+. Στη συνέχεια, παρουσιάζονται τόσο τα κλασικά στατιστικά εργαλεία όσο και σύγχρονα μοντέλα μηχανικής μάθησης, όπως Logistic Regression, Decision Trees, Random Forests, Support Vector Machines, Naive Bayes, Γραμμική Διακριτική Ανάλυση (LDA) και Νευρωνικά Δίκτυα. Μέσα από την ανάλυση επισημαίνονται τα πλεονεκτήματα και οι περιορισμοί κάθε προσέγγισης, ενώ δίνεται έμφαση στη δυνατότητα των μεθόδων τεχνητής νοημοσύνης να αξιοποιούν μεγάλα δεδομένα για πιο ακριβείς εκτιμήσεις κινδύνου. Επιπλέον, μελετώνται τα πιστωτικά παράγωγα, όπως τα Credit Default Swaps (CDS), τα οποία λειτουργούν ως εργαλεία μεταφοράς και αντιστάθμισης του πιστωτικού κινδύνου. Η εργασία ολοκληρώνεται με εμπειρική εφαρμογή σε πραγματικά δεδομένα, όπου αξιολογούνται οι επιδόσεις διαφορετικών μοντέλων πρόβλεψης. Τα αποτελέσματα δείχνουν ότι οι μέθοδοι μηχανικής μάθησης, σε συνδυασμό με τις παραδοσιακές στατιστικές προσεγγίσεις, μπορούν να βελτιώσουν ουσιαστικά την ακρίβεια πρόβλεψης και να ενισχύσουν τη διαχείριση του πιστωτικού κινδύνου, παρέχοντας πολύτιμα εργαλεία σε τράπεζες και χρηματοπιστωτικούς οργανισμούς, ιδιαίτερα στο ελληνικό και ευρωπαϊκό περιβάλλον.
  • Τεκμήριο
    Computational statistics and GPU acceleration
    (2025-07-28) Bampouris, Andreas; Μπαμπούρης, Ανδρέας; Vakeroudis, Stavros; Papagiannis, Georgios; Yannacopoulos, Athanasios
    Η πρακτική εφαρμογή σύγχρονων στατιστικών μεθόδων καθίσταται συχνά υπολογιστικά απαγορευτική, λόγω του διαρκώς αυξανόμενου όγκου των δεδομένων και της πολυπλοκότητας των μοντέλων. Η παρούσα εργασία εξετάζει πώς η επιτάχυνση μέσω Μονάδων Επεξεργασίας Γραφικών (GPU) μπορεί να διευρύνει το πεδίο εφαρμογής τέτοιων μεθόδων. Η εργασία δομείται σε τρεις άξονες: (1) τη θεωρητική ανάλυση των υπολογιστικών «σημείων συμφόρησης» σε δύο ευρέως διαδεδομένες αλλά και εξαιρετικά απαιτητικές μεθόδους, τις Μεθόδους Πυρήνα (Kernel Methods) και το Gradient Boosting, καθώς και του αλγοριθμικού ανασχεδιασμού που απαιτείται για την αποδοτική τους εκτέλεση σε GPU, (2) την εμπειρική επικύρωση των δυνητικών κερδών απόδοσης, μέσω της συγκριτικής αξιολόγησης δύο βιβλιοθηκών λογισμικού αιχμής σε GPU, των Falkon και XGBoost, έναντι των αντίστοιχων υλοποιήσεών τους σε CPU, ποσοτικοποιώντας την επιτάχυνση σε πραγματικά σύνολα δεδομένων, και (3) την επισκόπηση των πλαισίων λογισμικού που καθιστούν εφικτές τέτοιες υλοποιήσεις, χρησιμοποιώντας ως ενδεικτική μελέτη περίπτωσης την υλοποίηση ενός μαζικά παράλληλου δειγματολήπτη Markov Chain Monte Carlo (MCMC) σε CUDA. Τα αποτελέσματα καταδεικνύουν ότι η επίτευξη σημαντικών κερδών απόδοσης σε ευρέως διαθέσιμο υλικό GPU είναι εφικτή χωρίς καμία ουσιαστική απώλεια στατιστικής ακρίβειας, υπό την προϋπόθεση ότι οι αλγόριθμοι έχουν ανασχεδιαστεί ώστε να αξιοποιούν αποδοτικά τον παραλληλισμό και τις ιεραρχίες μνήμης. Γενικότερα, τα ευρήματα τεκμηριώνουν ότι η κλιμακωσιμότητα μεθόδων στατιστικής αποτελεί πρόβλημα τόσο μηχανικής λογισμικού, όσο και μεθοδολογίας: ο ανασχεδιασμός του αλγορίθμου, η δομή των δεδομένων, και η αρχιτεκτονική του υλικού απαιτούν συνδυαστική αντιμετώπιση. Προχωρώντας από τη θεωρία στην εμπειρική τεκμηρίωση και, τέλος, στην τεχνολογία της υλοποίησης, η παρούσα εργασία στοχεύει να γεφυρώσει το χάσμα μεταξύ της προηγμένης στατιστικής μοντελοποίησης και της υπολογιστικής υψηλών επιδόσεων, παρέχοντας τα εφόδια όχι μόνο για την αξιοποίηση των GPU, αλλά και για τη συνεισφορά στο ταχέως αναπτυσσόμενο αυτό πεδίο.
  • Τεκμήριο
    Testing for the assumptions of the Poisson-based football models
    (2025-07-02) Theodorakis, Angelos; Θεοδωράκης, Άγγελος; Karlis, Dimitrios; Chasiotis, Vasilis; Ntzoufras, Ioannis
    Η παρούσα διπλωματική εργασία εξετάζει βασικές παραδοχές στα μοντέλα ποδοσφαίρου βασισμένα στην κατανομή Poisson, εστιάζοντας ιδιαίτερα στο Overdispersion στο Αγγλικό Πρωτάθλημα της Premier League. Ο όρος Overdispersion αναφέρεται στην περίπτωση όπου η διακύμανση των αριθμών των τερμάτων είναι μεγαλύτερη από τον μέσο, και η εργασία διερευνά αν αυτό παρατηρείται στην Premier League. Η εργασία εξετάζει επίσης άλλες παραδοχές, όπως η υπερπληθώρα μηδενικών σκορ (αποτέλεσμα 0-0 ), πιθανές συσχετίσεις μεταξύ των σκορ των αντιπάλων ομάδων, καθώς και αν οι ικανότητες των ομάδων παραμένουν σταθερές ή εξελίσσονται με την πάροδο του χρόνου. Χρησιμοποιούνται διάφορες κατανομές, όπως Poisson, Negative Binomial, Inverse-Gaussian, Generalized Poisson και Conway-Maxwell Poisson, για να μοντελοποιηθεί το overdispersion. Οι κατανομές αξιολογούνται ως προς την προσαρμογή τους στα δεδομένα χρησιμοποιώντας κριτήρια όπως ο Δείκτης Πληροφορίας Akaike (AIC) και ο Δείκτης Πληροφορίας Bayesian (BIC). Τα αποτελέσματα δείχνουν ότι η κατανομή Poisson προσαρμόζεται καλά στα δεδομένα, όμως τείνει να υποεκτιμά τους αγώνες με μηδενικά τέρματα. Η κατανομή Negative Binomial έχει την καλύτερη προσαρμογή στα δεδομένα, ενώ η κατανομή Generalized Poisson κάνει και αυτή καλή προσαρμογή σε αντίθεση με τις κατανομές Inverse-Gaussian και Conway-Maxwell Poisson. Ωστόσο, η κακή προσαρμογή της κατανομής COM-Poisson ενδέχεται να οφείλεται στη χρήση method of moments για την εκτίμηση των παραμέτρων. Έπειτα, συγκρίνεται το overdispersion στους εντός και εκτός έδρας αγώνες ανά σεζόν και εξετάζεται η παρουσία του στις ομάδες της Premier League, σημειώνοντας διακυμάνσεις ανά σεζόν χωρίς όμως ξεκάθαρη τάση. Ορισμένες ομάδες, όπως η Newcastle και η West Ham, παρουσιάζουν σημαντικό overdispersion στους εκτός έδρας αγώνες, ενώ η Fulham εμφανίζει στους εντός έδρας αγώνες. Άλλες ομάδες, όπως η Huddersfield και η Wolves, παρουσιάζουν underdispersion. Στη συνέχεια ένα βασικό μοντέλο χρησιμοποιείται για κάθε μια από τις παραπάνω κατανομές, το οποίο περιλαμβάνει τις επιθετικές και αμυντικές ικανότητες κάθε ομάδας, τα τέρματα και το πλεονέκτημα έδρας ως παράγοντες. Μετά την προσαρμογή του μοντέλου Negative Binomial, το Dispersion Index ήταν για όλες τις σεζόν κοντά στη μονάδα, κάτι που υποδεικνύει ότι το μοντέλο εξήγησε την διασπορά. Εφαρμόζοντας επίσης μέθοδο bootstrap προκειμένου να συγκρίνουμε τις διαφορές των Deviance για τα μοντέλα Poisson και Negative Binomial, παρατηρούμε ότι δεν υπάρχουν σημαντικές ενδείξεις που να υποδεικνύουν ότι το μοντέλο Negative Binomial κάνει καλύτερη προσαρμογή. Ωστόσο, περαιτέρω αξιολόγηση με τα κριτήρια AIC και BIC έδειξε ότι, αν και το μοντέλο Poisson έχει καλή επίδοση, το μοντέλο Conway-Maxwell Poisson (COM-Poisson) προσφέρει καλύτερη προσαρμογή σε αρκετές σεζόν. Το underdispersion που παρατηρείται μετά την εφαρμογή του μοντέλου δείχνει ότι το αρχικό overdispersion εξηγήθηκε από το ίδιο το μοντέλο. Τέλος, η ενσωμάτωση των Τυχαίων Επιδράσεων στα μοντέλα, οι οποίες λαμβάνουν υπόψη τη μεταβλητότητα σε επίπεδο αγώνα, δεν βελτιώνει την προσαρμογή των μοντέλων Poisson, Negative Binomial και COM-Poisson, αλλά βελτιώνει την προσαρμογή του Generalized Poisson μοντέλου στις περισσότερες σεζόν. Συμπερασματικά, ενώ το μοντέλο Poisson παραμένει ένα αξιόπιστο εργαλείο για την ανάλυση των γκολ στην Premier League, το μοντέλο Conway-Maxwell-Poisson παρουσιάζει ακόμη καλύτερη προσαρμογή σε πολλές περιπτώσεις και δείχνει underdispersion μετά την προσαρμογή του μοντέλου, υποδηλώνοντας ότι η μεταβλητότητα που απομένει, είναι μικρότερη από αυτήν που θα υπέθετε το Poisson μοντέλο.
  • Τεκμήριο
    Εισαγωγή στον δυναμικό προγραμματισμό με αριθμητικές εφαρμογές
    (2025-07-16) Αρδούνη, Μαρία-Ελένη; Ardouni, Maria-Eleni; Ψαράκης, Στυλιανός; Δημητράκος, Θεοδόσης; Κυριακίδης, Επαμεινώνδας
    Ο Δυναμικός προγραμματισμός είναι ένας από τους πιο σημαντικούς κλάδους της Επιχειρησιακής Έρευνας και θεμελιώθηκε το 1953 από τον Richard Bellman. Στηρίζεται στην αρχή της βελτιστοποίησης και αποτελεί μέθοδο η οποία μπορεί να χρησιμοποιηθεί όταν τα υποπροβλήματα του κύριου προβλήματος δεν είναι ανεξάρτητα μεταξύ τους. Η μέθοδος επίλυσης τέτοιων προβλημάτων βασίζεται σε μία κατάλληλη αναδρομική σχέση και με τη σύνθεση των αποφάσεων των υποπροβλημάτων προκύπτει η ζητούμενη απόφαση. Στόχος της παρούσας διπλωματικής εργασίας είναι να αναλύσει τη χρησιμότητα του Δυναμικού Προγραμματισμού τόσο στην καθημερινή ζωή όσο και στους επιχειρηματικούς και οικονομικούς κλάδους. Στο πρώτο κεφάλαιο παρατίθεται ένα χαρακτηριστικό παράδειγμα του Δυναμικού Προγραμματισμού η εύρεση της βέλτιστης διαδρομής. Στη συνέχεια στα κεφάλαια 2 και 3 καταγράφονται τα χαρακτηριστικά του Δυναμικού Προγραμματισμού και οι κατηγορίες των προβλημάτων του. Ακόμη στο τρίτο κεφάλαιο παρατίθενται παραδείγματα από την κατηγορία των Ντετερμινιστικών προβλημάτων καθώς και ένα παράδειγμα γραμμικού προγραμματισμού το οποίο επιλύεται με διαφορετικούς τρόπους. Τέλος στο τέταρτο και τελευταίο κεφάλαιο περιγράφονται και επιλύονται παραδείγματα των προβλημάτων που ανήκουν στην κατηγορία των Στοχαστικών προβλημάτων.
  • Τεκμήριο
    Μία μη παραμετρική προσέγγιση για την μέτρηση του χρηματοοικονομικού κινδύνου με χρήση πυρήνων πιθανότητας
    (2025-07-10) Σημαντήρης, Ιωάννης; Γιαννακόπουλος, Αθανάσιος; Παπαγιάννης, Γεώργιος; Μπαλτάς, Ιωάννης
    Η παρούσα εργασία επικεντρώνεται στην μέτρηση του χρηματοοικονομικού κινδύνου χρησιμοποιώντας το μέτρο της VaR μέσα σε ένα μη παραμετρικό πλαίσιο που χαρακτηρίζεται από την χρήση πυρήνων πιθανότητας. Βασικό χαρακτηριστικό της συγκεκριμένης προσέγγισης είναι ότι χρησιμοποιεί την μέθοδο των συναρτήσεων πυρήνα για την εκτίμηση της κατανομής των αποδόσεων που απαρτίζουν την θέση μας. Παράλληλα, η συγκεκριμένη προσέγγιση θα συγκριθεί με δύο κλασσικές μεθόδους υπολογισμού της VaR, αυτήν της υπόθεσης ότι οι ημερήσιες αριθμητικές αποδόσεις ακολουθούν κανονική κατανομή, την μέθοδο της απλής ιστορικής προσομοίωσης, η οποία χρησιμοποιεί ιστορικά δεδομένα για την εκτίμηση της (VaR) βασιζόμενη στην εμπειρική κατανομή όπως αυτή περιγράφεται από το ιστόγραμμα. Χρησιμοποιήσαμε την εκτίμηση με χρήση πυρήνων πιθανότητας που είναι μια μη παραμετρική και στατιστικά προηγμένη μέθοδος, έτσι ώστε να μην ακολουθήσουμε τα κλασικά πλαίσια μέτρησης της αξίας σε κίνδυνο. Ο λόγος για τον οποίο προβήκαμε σε αυτή την μεθοδολογία είναι για να μπορέσουμε να περιγράψουμε με μεγαλύτερη ακρίβεια την κατανομή των αποδόσεων. Μέσα σε ένα πλαίσιο backtesting για την αξιολόγηση των μεθόδων ως προς την ικανότητα τους να μετρούν ικανοποιητικά και με ακρίβεια τον χρηματοοικονομικό κίνδυνο διεξήχθησαν τρεις ανάστροφοι έλεγχοι Kupiec, Christoffersen, Basel Traffic Light Test. Στο πρώτο κεφάλαιο γίνεται μια βασική εισαγωγή στην έννοια του κινδύνου, παρουσιάζεται το μέτρο της αξίας σε κίνδυνο και παρουσιάζεται το στατιστικό πλαίσιο που διέπει την παρούσα εργασία. Στο δεύτερο κεφάλαιο, πραγματοποιείται μια εμπειρική εφαρμογή των μεθόδων σε δεδομένα από τέσσερις ευρωπαϊκούς χρηματιστηριακούς δείκτες: IBEX 35, CAC 40, DAX και EURO STOXX 50. Τα δεδομένα καλύπτουν την περίοδο από 01/01/2015 έως 31/01/2025 και προέρχονται από την διαδικτυακή πλατφόρμα χρηματοοικονομικών δεδομένων Yahoo Finance. Η μεθοδολογία βασίζεται στην εφαρμογή των μεθόδων VaR με χρήση κινητών παραθύρων δύο χρονικών διαστημάτων 125 και 250 ημερών. Τελικά, καταγράφηκαν ως αποτελεσματικότερες οι μέθοδοι Historical VaR, KDE-based μέθοδοι ενώ η Normal VaR όπως αναμενόταν απεδείχθη ως η πιο αναποτελεσματική.
  • Τεκμήριο
    Models for expected field goals in basketball
    (2025-06-30) Tsadimas, Anargyros; Τσαδήμας, Ανάργυρος; Karlis, Dimitrios; Ntzoufras, Ioannis; Pelechrinis, Konstantinos
    Τα τελευταία χρόνια, η αναλυτική προσέγγιση έχει αλλάξει ριζικά τον τρόπο με τον οποίο βλέπουμε το μπάσκετ — από την αξιολόγηση παικτών και σουτ, μέχρι τον σχεδιασμό επιθετικών στρατηγικών. Αφορμή για την παρούσα μελέτη στάθηκαν αναλύσεις πάνω στα corner 3s, που έδειξαν πως η υψηλή τους αποτελεσματικότητα δεν οφείλεται τόσο στη μικρότερη απόσταση, όσο στη μεγάλη πιθανότητα να προκύπτουν από assist. Αυτό έθεσε το ερώτημα: μήπως και κάποια σουτ μέσης απόστασης έχουν παρόμοια κρυμμένη αξία; Με βάση δεδομένα καταγραφής παικτών και φάσεων από τις σεζόν NBA 2013–14 και 2014–15, δημιουργήθηκαν μοντέλα που εκτιμούν την πιθανότητα ευστοχίας (xFG%) με βάση στοιχεία όπως η θέση στο γήπεδο, ο χρόνος στο ρολόι, η απόσταση του αμυντικού, ο τύπος σουτ και ο χρόνος που κρατήθηκε η μπάλα. Η ανάλυση έδειξε ότι τα catch-and-shoot σουτ — όταν εκτελούνται γρήγορα — έχουν αυξημένα ποσοστά επιτυχίας. Η απόσταση του αμυντικού, η διαφορά στο σκορ και ο χρονισμός της επίθεσης παίζουν επίσης σημαντικό ρόλο. Το τελικό μοντέλο ενσωματώνει και στοιχεία ανά παίκτη μέσω LASSO, αναδεικνύοντας κάποιους κορυφαίους σουτέρ μέσης απόστασης που ξεχωρίζουν. Πέρα από την πρόβλεψη ευστοχίας, το επίκεντρο της μελέτης είναι η ποιότητα της επιλογής σουτ — δηλαδή όχι μόνο αν μπήκε, αλλά αν άξιζε να εκτελεστεί. Τα αποτελέσματα δείχνουν ότι συγκεκριμένοι παίκτες και σημεία στο γήπεδο προσφέρουν υψηλή αξία, ξεπερνώντας μάλιστα σε αποδοτικότητα τον μέσο όρο των τριπόντων. Η σωστή ανακατανομή τέτοιων προσπαθειών μπορεί να δώσει μετρήσιμο πλεονέκτημα σε βάθος σεζόν.
  • Τεκμήριο
    Hidden Markov Models and their application in modeling rainfall occurrence
    (2025-06-06) Grammenos, Konstantinos; Γραμμένος, Κωνσταντίνος; Pavlopoulos, Charalampos; Yannacopoulos, Athanasios; Besbeas, Panagiotis
    Η μοντελοποίηση δεδομένων ημερήσιων βροχοπτώσεων αποτελεί σημαντικό πεδίο έρευνας ιδίως σε περιοχές όπως η βορειοανατολική Βραζιλία, όπου οι καιρικές συνθήκες επηρεάζονται από σύνθετα φαινόμενα που σχετίζονται με την ατμόσφαιρα και τη θερμοκρασία του ωκεανού. Η ανάπτυξη στοχαστικών μοντέλων είναι απαραίτητη για την κατανόηση των μοτίβων βροχόπτωσης, τη διαχείριση υδάτινων πόρων και την πρόβλεψη μελλοντικών φαινομένων. Στην παρούσα διατιβή διερευνάται η χρήση Κρυφών Μαρκοβιανών Μοντέλων (HMMs) για τη μοντελοποίηση ημερήσιων δεδομένων βροχόπτωσεων σε περιόδο 90 ημερών, για 24 χρόνια (1975–2002) στην πολιτεία Ceará της Βορειοανατολικής Βραζιλίας. Αρχικά, παρουσιάζεται εφαρμογή στα δυαδικά δεδομένα του θερμοπίδακα ”Old Faithful”, ως εισαγωγή στα HMMs. Έπειτα, εφαρμόζονται ομοιογενή HMMs στα δεδομένα βροχοπτώσεων, αποκαλύπτοντας 4 υποβόσκουσες καταστάσεις: δύο που αντιστοιχούν σε βροχερές και ξηρές συνθήκες και δύο μεταβατικές, με αντίστροφες πιθανοτήτες βροχοπτώσης μεταξύ βόρειων και νότιων σταθμών. Η ανάλυση συνεχίζεται με την ενσωμάτωση εξωτερικών κλιματικών δεδομένων μεγάλης κλίμακας και πιο συγκεκριμένα της προσομοιωμένης εποχικής μέσης απόκλισης βροχόπτωσης που προέρχεται από ένα μοντέλο Γενικής Κυκλοφορίας (GCM), ως εξωτερικής μεταβλητής σε ένα μη ομοιογενές HMM (NHMM). Με το μοντέλο αυτό, αποδεικνύεται ότι αυτή η εξωτερική μεταβλητή επηρεάζει τη μετάβαση μεταξύ των καταστάσεων. Επιπλέον, η ίδια μεταβλητή ενσωματώνεται μέσω λογιστικής παλινδρόμησης στη διαδικασία παρατήρησης. Το βέλτιστο από αυτά μοντέλο, δείχνει πως ενώ κάθε σταθμός παρουσιάζει διαφορετική βασική πιθανότητα βροχής, η επίδραση της κλιματικής μεταβλητής είναι συνεπής σε όλη την περιοχή. Τέλος, εξετάζεται εναλλακτική προσέγγιση όπου κάθε έτος μοντελοποιείται ως ανεξάρτητη εποχική ακολουθία αντί μια συνεχόμενη σειρά 2,160 ημερών. Τα αποτελέσματα υπογραμμίζουν τη σημασία των HMMs και της ενσωμάτωσης κλιματικών μεταβλητών στην κατανόηση και πρόβλεψη των βροχοπτώσεων.
  • Τεκμήριο
    Credit risk and credit derivatives
    (2025-06-20) Boci, Konstadin; Μπότσι, Κωνσταντίν; Zimbidis, Alexandros; Vakeroudis, Stavros; Yannacopoulos, Athanasios
    Πιστωτικός Κίνδυνος & Μηχανική Μάθηση Ο πιστωτικός κίνδυνος αναφέρεται στην πιθανότητα ο δανειολήπτης να μην μπορεί να αποπληρώσει τα δάνειά του, κάτι που προκαλεί οικονομικές απώλειες για τον δανειστή. Ο κίνδυνος αυτός είναι εγγενής σε διάφορα χρηματοοικονομικά προϊόντα, όπως τα δάνεια και τα ομόλογα. Οι απώλειες που μπορεί να υποστεί ο επενδυτής περιλαμβάνουν: Χαμένα κεφάλαια, Μη ληφθέντες τόκους, Μειωμένες ταμειακές ροές. Σε αυτό το έργο, εστιάζουμε σε θεμελιώδη και στατιστικά μοντέλα μηχανικής μάθησης για: Την εκτίμηση, Τη μοντελοποίηση, Τη διαχείριση του πιστωτικού κινδύνου, καθώς και στη μελέτη παραγώγων συμβολαίων με στόχο τη μείωση και διαχείρισή του. Ορισμένες ιδιότητες που δυσκολεύουν την ποσοτική μοντελοποίηση του πιστωτικού κινδύνου είναι: Τα γεγονότα χρεοκοπίας είναι σπάνια και συχνά απροσδόκητα, οι ζημιές είναι σημαντικές και το μέγεθος των απωλειών δεν είναι γνωστό πριν τη χρεοκοπία. Μοντέλα Μηχανικής Μάθησης Υπάρχουν πολλά μοντέλα μηχανικής μάθησης, και η καταλληλότητα του καθενός εξαρτάται από τις μεταβλητές που έχουμε διαθέσιμες. Η επιλογή αλγορίθμου βασίζεται σε παράγοντες όπως: Τύπος δεδομένων, Διαφάνεια χαρακτηριστικών (features), Διαλειτουργικότητα (interoperability). 1. Λογιστική Παλινδρόμηση (Logistic Regression) Μοντελοποιεί πιθανότητες στο διάστημα [0,1] χρησιμοποιώντας τη λογιστική συνάρτηση (logit). Συχνά εφαρμόζονται τεχνικές κανονικοποίησης όπως: Lasso, Ridge, Elastic Net, για να αποφευχθεί η υπερπροσαρμογή (overfitting). 2. SVM (Support Vector Machine) Χρησιμοποιεί υπερεπίπεδο (hyperplane) σε πολυδιάστατο χώρο για να διαχωρίσει δύο κατηγορίες. Με τη χρήση πυρηνικών συναρτήσεων (kernel functions) μπορεί να μοντελοποιήσει μη γραμμικά προβλήματα ταξινόμησης. 3. Naive Bayes Βασίζεται στο θεώρημα του Bayes και απαιτεί την ισχυρή υπόθεση της ανεξαρτησίας των χαρακτηριστικών. Αν και απλός στην υλοποίηση, έχει συχνά χαμηλή απόδοση όταν η υπόθεση ανεξαρτησίας δεν ισχύει. 4. Δέντρα Απόφασης (Decision Trees) Η πρόβλεψη γίνεται μέσω διαδοχικών κόμβων και διακλαδώσεων. Παρότι είναι ευέλικτο εργαλείο, παρουσιάζουν συχνά υπερπροσαρμογή. Για την αντιμετώπιση αυτού, χρησιμοποιούμε το: 5. Random Forest - Αποτελεί σύνολο από πολλά δέντρα απόφασης, όπου κάθε δέντρο εκπαιδεύεται με τυχαίο υποσύνολο δεδομένων και χαρακτηριστικών. Η τυχαιότητα μειώνει τον κίνδυνο υπερπροσαρμογής και βελτιώνει τη συνολική απόδοση πρόβλεψης.
  • Τεκμήριο
    Χρήση διαγραμμάτων ελέγχου για την παρακολούθηση καλής λειτουργίας ανεμογεννητριών, προβλεπτική συντήρηση δομικών εξαρτημάτων και εφαρμογές σε ανανεώσιμες πηγές ενέργειας
    (2025-06-13) Σχοινάς, Βασίλειος; Παπασταμούλης, Παναγιώτης; Βρόντος, Ιωάννης; Ψαράκης, Στυλιανός
    Περισσότερο από ποτέ, ο ενεργειακός ανασχηματισμός παίζει καθοριστικό ρόλο στην διαμόρφωση των πολιτικών, των κοινωνικών συμπεριφορών, της οικονομίας και της βιομηχανικής παραγωγής. Η αιολική ενέργεια, παίζει έναν καθοριστικό ρόλο στον μετασχηματισμό αυτό. Επιπλέον, η αναβάθμιση των ενεργειακών αγορών, η ανάγκη χειρισμών και αποφάσεων σε πραγματικό χρόνο, η πληθώρα δεδομένων και η ανάγκη για αδιάλειπτη παροχή ηλεκτρικής ενέργειας σε εξισορροπημένα και ευσταθή δίκτυα, οδηγούν στην ανάπτυξη νέων τεχνικών ελέγχου. Τα διαγράμματα ελέγχου, άμεσα συνδεδεμένα με τις παραγωγικές διαδικασίες, δεν θα μπορούσαν να μην αποτελούν ένα ισχυρό εργαλείο για όσους και όσες ασχολούνται με την λειτουργεία και συντήρηση ανεμογεννητριών. Οι νέες προκλήσεις αντιμετωπίζονται με νέες αρχιτεκτονικές στατιστικών ελέγχων. Τα διαγράμματα ελέγχου, λόγω της ερμηνευσιμότητάς τους μπορούν να συνεισφέρουν, είτε αυτούσια, είτε ως κομμάτια υβριδικών τεχνικών με μοντέλα μηχανικής μάθησης. Σε αυτήν την εργασία παρουσιάζεται μία συστηματική ανασκόπηση και αναφορά των πιο πρόσφατων εφαρμογών διαγραμμάτων ελέγχου στις ΑΠΕ, και συγκεκριμένα στην αιολική ενέργεια. Παράλληλα, παρουσιάζονται κάποιες πρωτότυπες εφαρμογές σε πραγματικά case studies, με στόχο την ανάδειξη των διαγραμμάτων ελέγχου και των δυνατοτήτων τους.