Εντοπίστηκε ένα σφάλμα στη λειτουργία της ΠΥΞΙΔΑΣ όταν χρησιμοποιείται μέσω του προγράμματος περιήγησης Safari. Μέχρι να αποκατασταθεί το πρόβλημα, προτείνουμε τη χρήση εναλλακτικού browser όπως ο Chrome ή ο Firefox. A bug has been identified in the operation of the PYXIDA platform when accessed via the Safari browser. Until the problem is resolved, we recommend using an alternative browser such as Chrome or Firefox.
 

Forecasting GDP growth series using advanced econometric models and machine learning techniques

Φόρτωση...
Μικρογραφία εικόνας

Ημερομηνία

2025-03-31

Συγγραφείς

Καριντζή, Αναστασία
Karintzi, Anastasia

Τίτλος Εφημερίδας

Περιοδικό ISSN

Τίτλος τόμου

Εκδότης

Επιβλέπων

Διαθέσιμο από

Περίληψη

Η παρούσα διατριβή αποσκοπεί στη δημιουργία οικονομετρικών μοντέλων και μοντέλων μηχανικής μάθησης για την πρόβλεψη των τιμών της εξαρτημένης μεταβλητής, της αύξησης του πραγματικού ΑΕΠ των ΗΠΑ. Αρχικά, έχουμε 31 ανεξάρτητες μεταβλητές που περιέχουν τριμηνιαίες τιμές ξεκινώντας από το πρώτο τρίμηνο του 1992 έως το πρώτο τρίμηνο του 2024. Δημιουργήσαμε 33 μοντέλα, τα οποία βασίζονται σε προηγμένες οικονομετρικές μεθόδους και τεχνικές μηχανικής μάθησης και εξηγούνται λεπτομερώς στο κύριο μέρος της διατριβής. Οι μεθοδολογίες που χρησιμοποιήσαμε είναι οι εξής: Πολλαπλή γραμμική παλινδρόμηση, Ridge, Lasso, Elastic Net, παλινδρόμηση κύριων συνιστωσών (Principal Component Regression) (PCR), Μερικά Ελάχιστα Τετράγωνα (Partial Least Squares) (PLS), δέντρα παλινδρόμησης (Regression Trees), τυχαία δάση (Random Forests), Gradient Boosting Machines (GBM), Autoregressive Model (AR) και Autoregressive Moving Average Model (ARMA). Για να προβλέψουμε την εξαρτημένη μεταβλητή, την αύξηση του πραγματικού ΑΕΠ των ΗΠΑ, χρησιμοποιήσαμε αναδρομική πρόβλεψη εκτός δείγματος για να αξιολογήσουμε την απόδοση του μοντέλου και βρήκαμε τις τιμές πρόβλεψης για 3 ορίζοντες, 6 μήνες, 1 έτος και 2 έτη. Τα μοντέλα αξιολογήθηκαν μέσω μετρικών αξιολόγησης και σχετικών μετρικών, όπως το σχετικό μέσο τετραγωνικό σφάλμα πρόβλεψης (Relative Root Mean Squared Forecast Error - relRMSFE) και το Sign Success Ratio - SSR, για να εκτιμηθεί η κατευθυντική προβλεπτική ικανότητα των μοντέλων. Τα ευρήματα της παρούσας έρευνας καταδεικνύουν ότι το μοντέλο Ridge Regression αποδίδει καλύτερα για τον βραχυπρόθεσμο ορίζοντα, έχοντας χαμηλότερα σφάλματα πρόβλεψης και μεγαλύτερη ακρίβεια πρόβλεψης. Για τους μεσοπρόθεσμους και μακροπρόθεσμους ορίζοντες, το μοντέλο PLS με 14 συνιστώσες (PLS(14)) φαίνεται να είναι το πιο αξιόπιστο, αποκαλύπτοντας ανώτερες επιδόσεις στην ελαχιστοποίηση του σφάλματος πρόβλεψης. Οι τεχνικές μείωσης της διαστατικότητας, όπως η PCR και η PLS, είναι ιδιαίτερα αποτελεσματικές σε εκτεταμένους ορίζοντες, ενώ οι μέθοδοι κανονικοποίησης όπως η Ridge και η Lasso έχουν καλύτερα αποτελέσματα σε βραχυπρόθεσμες περιόδους. Η έρευνα αυτή υπογραμμίζει την αναγκαιότητα προσαρμογής της επιλογής του μοντέλου στον ορίζοντα και τους στόχους της πρόβλεψης. Συνδυάζοντας τεχνικές μηχανικής μάθησης με κλασικές και προηγμένες οικονομετρικές μεθοδολογίες, η παρούσα διατριβή δίνει πολύτιμες πληροφορίες για τη βελτίωση της ακρίβειας των μακροοικονομικών προβλέψεων και συμβάλλει στον αναδυόμενο τομέα της οικονομικής μοντελοποίησης με βάση τα δεδομένα.
This thesis aims to create econometric and machine-learning models to forecast the values of the dependent variable, U.S. Real GDP growth. In the beginning, we have 31 independent variables that contain quarterly prices starting from the first quarter of 1992 until the first quarter of 2024. We created 33 models, which are based on advanced econometric methods and machine learning techniques and are explained in detail in the main part of the thesis. The methodologies we employed are the following: Multiple Linear Regression, Ridge, Lasso, Elastic Net, Principal Component Regression (PCR), Partial Least Squares (PLS), Regression Trees, Random Forests, Gradient Boosting Machines (GBM), Autoregressive Model (AR), and Autoregressive Moving Average Model (ARMA). To predict the dependent variable, U.S. Real GDP growth, we used recursive out-of-sample forecasting to evaluate model performance and found the forecasting values over 3 horizons, 6-months, 1-year, and 2-years. The models were evaluated through evaluation metrics and relative metrics, such as the Relative Root Mean Squared Forecast Error (relRMSFE) and Sign Success Ratio (SSR) to assess the directional predictive ability of the models. The findings of this research demonstrate that the Ridge Regression model performs best for the short-term horizon, having lower forecast errors and greater predictive accuracy. For medium- and long-term horizons, the PLS model with 14 components (PLS(14)) appears to be the most reliable, revealing superior performance in minimizing forecast error. Dimensionality reduction techniques, such as PCR and PLS, are particularly effective over extended horizons, while regularization methods like Ridge and Lasso have better results in short-term periods. This research emphasizes the necessity of adapting model selection to the forecasting horizon and aims. By combining machine learning techniques with classic and advanced econometric methodologies, this thesis gives valuable insights into improving macroeconomic forecast accuracy and contributes to the emerging field of datadriven economic modeling.

Περιγραφή

Λέξεις-κλειδιά

U.S. Real GDP growth, Forecasting, Machine learning techniques, Econometric methods, Δημιουργία οικονομετρικών μοντέλων, Μηχανική μάθηση, Πρόβλεψη, Οικονομετρικές μέθοδοι

Παραπομπή