A comprehensive survey of economic and financial time series forecasting: from econometric models to PCA-based statistical arbitrage
Ημερομηνία
2026-01-19
Συγγραφείς
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Επιβλέπων / ουσα
Διαθέσιμο από
Περίληψη
Η παρούσα διατριβή διερευνά την εξέλιξη και την εμπειρική εφαρμογή των μεθοδολογιών πρόβλεψης σε οικονομικές και χρηματοοικονομικές χρονοσειρές. Εξετάζει τη μετάβαση από τα κλασικά οικονομετρικά υποδείγματα – όπως τα ARIMA, GARCH και VAR – προς τα σύγχρονα πλαίσια μηχανικής μάθησης, συμπεριλαμβανομένων των Gradient Boosting και Transformer. Η ανάλυση αναδεικνύει τους συμβιβασμούς μεταξύ ερμηνευσιμότητας και προγνωστικής ακρίβειας, καθώς και τον αυξανόμενο ρόλο των δεδομενοκεντρικών προσεγγίσεων σε περιβάλλοντα υψηλής διαστατικότητας. Κεντρική συμβολή της μελέτης αποτελεί η ενσωμάτωση της Ανάλυσης Κύριων Συνιστωσών (PCA) ως ενοποιητικού στατιστικού πλαισίου που γεφυρώνει την οικονομετρία με τις υπολογιστικές μεθόδους. Η PCA εφαρμόζεται σε εκτεταμένα πάνελ αποδόσεων μετοχών για την εξαγωγή λανθανόντων παραγόντων που αποτυπώνουν τη συστηματική δυναμική των αγορών, οι οποίοι στη συνέχεια ενσωματώνονται σε κανονικοποιημένα παλινδρομικά μοντέλα για την πρόβλεψη μεταβολών στην καμπύλη αποδόσεων των αμερικανικών κρατικών ομολόγων. Η εμπειρική ανάλυση βασίζεται σε ημερήσια δεδομένα τιμών μετοχών των 503 εταιρειών του δείκτη S&P 500 από το Yahoo Finance και στη διαφορά αποδόσεων 10ετούς – 2ετούς διάρκειας των αμερικανικών ομολόγων από τη βάση FRED για την περίοδο Σεπτέμβριος 2020 – Σεπτέμβριος 2025. Τα αποτελέσματα δείχνουν ότι τα υποδείγματα PCA, ιδιαίτερα εκείνα με κανονικοποίηση LASSO, υπερέχουν των κλασικών οικονομετρικών μοντέλων ως προς την ακρίβεια και τη σταθερότητα πρόβλεψης. Συνολικά, τα ευρήματα υποστηρίζουν τις υβριδικές προσεγγίσεις που συνδυάζουν την οικονομετρική δομή με τις δεδομενο-κεντρικές μεθόδους ως αποτελεσματικό πλαίσιο για την κατανόηση και πρόβλεψη των πολύπλοκων δυναμικών των χρηματοοικονομικών αγορών.This thesis investigates the evolution and empirical implementation of forecasting methodologies for economic and financial time series. It examines the progression from classical econometric models – such as ARIMA, GARCH, and VAR – to modern machine learning frameworks including Gradient Boosting and Transformer architectures. The analysis highlights the trade-offs between interpretability and predictive performance and emphasizes the growing relevance of data-driven methods in high-dimensional financial settings. A central contribution of the study is the integration of Principal Components Analysis (PCA) as a unifying statistical framework bridging econometric and computational approaches. PCA is applied to large panels of equity returns to extract latent factors that capture systematic market dynamics, which are then incorporated into regularized regression models for forecasting movements in the U.S. Treasury yield curve. The empirical analysis uses two datasets: daily stock prices for the 503 S&P 500 constituents from Yahoo Finance, and the 10-year minus 2-year U.S. Treasury yield spread from FRED, covering the period September 2020 – September 2025. The results show that PCA-based regressions, particularly those employing LASSO regularization, outperform traditional econometric benchmarks in forecasting accuracy and stability. Overall, the findings support hybrid methodologies that combine econometric structure with data-driven modeling as an effective framework for capturing complex financial dynamics.
Περιγραφή
Λέξεις-κλειδιά
Forecasting, Principal Components Analysis (PCA), Hybrid methodologies, Πρόβλεψη, Ανάλυση κύριων συνιστωσών (PCA), Υβριδικές προσεγγίσεις

