Abstract : | Στην ανάλυση χρονοσειρών είναι πολύ σύνηθες να ερχόμαστε αντιμέτωποι με περιπτώσεις δεδομένων που παρουσιάζουν εποχικότητα ή και κάποιας μορφή τάση. Η γενική μεθοδολογία που αναπτύχθηκε από τους Box και Jenkins (1970) μας έδωσε την κλάση των ARIMA μοντέλων και της ειδικής υποκατηγορίας SARIMA μοντέλων. Αυτό μέχρι και σήμερα αποτελεί ένα πολύ ισχυρό εργαλείο για την περιγραφή χρονοσειρών με τέτοια χαρακτηριστικά και πρόβλεψη μελλοντικών παρατηρήσεων. Μια άλλη μεγάλη γκάμα μοντέλων που κερδίζουν μεγάλο έδαφος τα τελευταία χρόνια είναι τα λεγόμενα state space μοντέλα. Μια πολύ ευρεία υποκατηγορία state space μοντέλων είναι τα λεγόμενα Dynamic Linear Models (DLM’s) τα οποία παρά την γενικότερη απλότητα τους μπορούν να χρησιμοποιηθούν για την αποτύπωση χαρακτηριστικών που διέπουν χρονοσειρές αληθινών δεδομένων όπως είναι η τάση και η εποχικότητα. Η διαδικασία της προσαρμογής των μοντέλων και πρόβλεψης μελλοντικών παρατηρήσεων γίνεται μέσω της μεθοδολογίας που είναι γνωστή ως Kalman φίλτρο η οποία πρωτοπαρουσιάστηκε από τον Kalman to 1960.Σε αυτήν την εργασία αναλύονται όλα τα βασικά χαρακτηριστικά της συνομοταξίας των ARIMA και SARIMA μοντέλων και της κλάσης των DLM μοντέλων. Στη συνέχεια διενεργείται έλεγχος της προβλεπτικής ικανότητας τους βασιζόμενοι σε δύο διαφορετικές μεθόδους αξιολόγησης οι οποίες είναι ο υπολογισμός των συνήθη μέτρων για σφάλματα, δηλαδή τα MSE, MAD και MAPE, και στη μεθοδολογία cross-validation εδικά προσαρμοσμένη για δεδομένα χρονοσειρών. Η εφαρμογή των μεθόδων και η σύγκριση της προβλεπτικής ικανότητας των μοντέλων έγινε σε δύο διαφορετικά πραγματικά σύνολα δεδομένων: το πρώτο αφορά μηνιαίους αριθμούς γεννήσεων στην πόλη της Νέας Υόρκης και το δεύτερο σχετίζεται με μηνιαίες πωλήσεις αυτοκινήτων λιανικού εμπορίου στις ΗΠΑ. In time series analysis, it is very common to encounter cases of data that show seasonality or some form of a trend. The general methodology developed by Box and Jenkins (1970) gave us the class of ARIMA models and the special subcategory of SARIMA models. This is still a very powerful tool for describing time series with such features and predicting future observations.Another large class of models that are gaining ground in recent years is the so-called state space models. A very broad subcategory of state space models is the so-called Dynamic Linear Models (DLM’s) which, despite their general simplicity, can be used to capture features that govern real-time time series such as trend and seasonality. The process of fitting the models and predicting future observations is done through the methodology known as the Kalman filter which was first introduced by Kalman in 1960.This thesis analyzes all the key features of the ARIMA and SARIMA models and the DLM model class. Then, their predictive ability is tested based on two different evaluation methods which are the calculation of the usual error measures, namely MSE, MAD and MAPE, and the cross-validation methodology specifically adapted for time series data.The application of the methods and the comparison of their predictive capacity of the were done in two different real data sets: the first concerns monthly birth numbers in New York City and the second is related to monthly retail automobile sales in the USA.
|
---|