Modelling and forecasting unemployment time series
Ημερομηνία
2026-02-25
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Επιβλέπων / ουσα
Διαθέσιμο από
Περίληψη
The purpose of this thesis is to develop machine learning and econometric models to forecast the values of the dependent variable, U.S. unemployment rate. In the beginning, we have 26 independent variables that contain quarterly data with a starting date of the second quarter of 2003 through the third quarter of 2024. The main part of the thesis provides a detailed explanation of the 11 models we developed, which are based on advanced econometric methods and machine learning techniques. The methodologies we used are the following: Multiple Linear Regression, Ridge Regression, Lasso Regression, Elastic Net Regression, Principal Component Analysis (PCA), Partial Least Squares (PLS), Random Forests, Gradient Boosting Machines (GBM), Autoregressive Model (AR), Moving Average Model (MA) and Autoregressive Moving Average Model (ARMA). In order to predict our dependent variable, U.S. unemployment rate, we employed recursive out-of-sample forecasting to assess model performance and found the forecasting values over 2 horizons, 6 - months and 1 - year. The models were assessed using evaluation metrics and relative metrics, such as relative Mean Absolute Error (MAE), relative Mean Squared Forecast Error (MSFE), relative Root Mean Squared Forecast Error (RMSFE) to assess the predictive ability of the models. The results of this study show that the Ridge regression model works well for the short-term horizon (i.e. h=1 and h=2), having lower forecast errors and so, it is more suitable for creating accurate forecasts until 6 – months. For long-term horizons (i.e. h = 4), the Random Forest seems to be the most reliable, demonstrating better effectiveness in reducing forecast error. This research highlights how important is to adapt model selection to the forecasting horizon. This thesis advances the field of data-driven economic modelling and provides important insights into enhancing macroeconomic forecast accuracy by fusing machine learning methods with traditional and advanced econometric methodologies.Σκοπός της παρούσας διατριβής είναι η ανάπτυξη μοντέλων μηχανικής μάθησης και οικονομετρικών μοντέλων για την πρόβλεψη των τιμών της εξαρτημένης μεταβλητής, του ποσοστού ανεργίας στις Ηνωμένες Πολιτείες. Στην αρχή, έχουμε 26 ανεξάρτητες μεταβλητές που περιέχουν τριμηνιαία δεδομένα με ημερομηνία έναρξης το δεύτερο τρίμηνο του 2003 έως το τρίτο τρίμηνο του 2024. Το κύριο μέρος της διατριβής παρέχει μια λεπτομερή εξήγηση των 11 μοντέλων που αναπτύξαμε, τα οποία βασίζονται σε προηγμένες οικονομετρικές μεθόδους και τεχνικές μηχανικής μάθησης. Οι μεθοδολογίες που χρησιμοποιήσαμε είναι οι εξής: Πολλαπλή γραμμική παλινδρόμηση, παλινδρόμηση Ridge, παλινδρόμηση Lasso, παλινδρόμηση Elastic Net, ανάλυση κύριων συνιστωσών (PCA), μερική ελάχιστη τετραγωνική μέθοδος (PLS), Random Forests, GBM, αυτοπαλινδρομικό μοντέλο (AR), μοντέλο κινητού μέσου όρου (MA) και μοντέλο ARMA. Προκειμένου να προβλέψουμε την εξαρτώμενη μεταβλητή μας, το ποσοστό ανεργίας στις ΗΠΑ, χρησιμοποιήσαμε αναδρομική πρόβλεψη εκτός δείγματος για να αξιολογήσουμε την απόδοση του μοντέλου και βρήκαμε τις τιμές πρόβλεψης σε 2 ορίζοντες, 6 μήνες και 1 έτος. Τα μοντέλα αξιολογήθηκαν χρησιμοποιώντας μετρήσεις αξιολόγησης και σχετικές μετρήσεις, όπως το σχετικό μέσο απόλυτο σφάλμα (MAE), το σχετικό μέσο τετραγωνικό σφάλμα πρόβλεψης (MSFE) και το σχετικό μέσο τετραγωνικό σφάλμα πρόβλεψης (RMSFE), προκειμένου να εκτιμηθεί η προγνωστική ικανότητα των μοντέλων. Τα αποτελέσματα αυτής της μελέτης δείχνουν ότι το μοντέλο παλινδρόμησης Ridge λειτουργεί καλά για τον βραχυπρόθεσμο ορίζοντα, έχοντας χαμηλότερα σφάλματα πρόβλεψης και, ως εκ τούτου, είναι καταλληλότερο για τη δημιουργία ακριβών προβλέψεων έως και 6 μήνες.Για μακροπρόθεσμους ορίζοντες, το Random Forest φαίνεται να είναι το πιο αξιόπιστο, επιδεικνύοντας καλύτερη αποτελεσματικότητα στη μείωση του σφάλματος πρόβλεψης. Η έρευνα αυτή υπογραμμίζει πόσο σημαντικό είναι να προσαρμόζεται η επιλογή του μοντέλου στον ορίζοντα πρόβλεψης. Η διατριβή αυτή προωθεί τον τομέα της οικονομικής μοντελοποίησης βάσει δεδομένων και παρέχει σημαντικές πληροφορίες για τη βελτίωση της ακρίβειας των μακροοικονομικών προβλέψεων, συνδυάζοντας μεθόδους μηχανικής μάθησης με παραδοσιακές και προηγμένες οικονομετρικές μεθοδολογίες.
Περιγραφή
Λέξεις-κλειδιά
Forecasting, Models, Horizon, Πρόβλεψη, Μοντέλα, Ορίζοντας

