Predictability of Henry Hub natural gas prices using econometric and machine learning models
Ημερομηνία
2026-03-26
Συγγραφείς
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Επιβλέπων / ουσα
Διαθέσιμο από
Περίληψη
This master’s thesis examines the predictability of monthly Henry Hub natural gas prices (U.S.) by comparing econometric models (SARIMA, SARIMAX) with machine learning models (LSTM, Random Forest). Using 297 monthly observations from January 2001 to September 2025 and ten exogenous variables, which were time-aligned and transformed to ensure stationarity, a rolling one-step-ahead out-of-sample forecasting procedure is implemented. Model performance is evaluated using RMSE, MAE, SMAPE, and Directional Accuracy. The results show that the LSTM models outperform the alternatives overall, with LSTM(24) achieving the lowest RMSE and LSTM(36) delivering the best MAE and SMAPE values. SARIMA records the highest Directional Accuracy, while SARIMAX provides limited additional predictive value. In contrast, the Random Forest models underperform overall and remain close to a random benchmark in predicting the direction of price changes. The thesis concludes that LSTM models are the most effective for short-term forecasting of Henry Hub prices, while SARIMA remains a reliable benchmark.Η παρούσα διπλωματική εργασία εξετάζει την προβλεψιμότητα των μηνιαίων τιμών φυσικού αερίου Henry Hub (ΗΠΑ) μέσω σύγκρισης οικονομετρικών μοντέλων (SARIMA, SARIMAX) και μοντέλων μηχανικής μάθησης (LSTM, Random Forest). Χρησιμοποιώντας 297 μηνιαίες παρατηρήσεις από τον Ιανουάριο 2001 έως τον Σεπτέμβριο 2025 και δέκα εξωγενείς μεταβλητές, οι οποίες ευθυγραμμίστηκαν χρονικά και μετασχηματίστηκαν ώστε να διασφαλιστεί η στασιμότητα των σειρών, πραγματοποιείται rolling one-step-ahead out-of-sample πρόβλεψη ενός μήνα. Η αξιολόγηση βασίζεται στις μετρικές RMSE, MAE, SMAPE και Directional Accuracy. Τα αποτελέσματα δείχνουν ότι τα μοντέλα LSTM υπερτερούν συνολικά, με το LSTM(24) να επιτυγχάνει το χαμηλότερο RMSE και το LSTM(36) τις καλύτερες τιμές σε MAE και SMAPE. Το SARIMA παρουσιάζει την υψηλότερη Directional Accuracy, ενώ το SARIMAX προσφέρει περιορισμένη πρόσθετη αξία. Αντίθετα, τα μοντέλα Random Forest υστερούν συνολικά και παραμένουν κοντά σε τυχαίο benchmark ως προς την κατεύθυνση των μεταβολών. Η εργασία καταλήγει ότι για τη βραχυπρόθεσμη πρόβλεψη των τιμών Henry Hub τα LSTM είναι τα πιο αποτελεσματικά μοντέλα με το SARIMA να αποτελεί αξιόπιστο σημείο αναφοράς.
Περιγραφή
Λέξεις-κλειδιά
Price predictability, Time series forecasting, Econometric models, Machine learning models, Προβλεψιμότητα τιμών, Πρόβλεψη χρονοσειρών, Οικονομετρικά μοντέλα, Μοντέλα μηχανικής μάθησης

