Περίληψη : | Στόχος αυτής της εργασίας είναι να δωθεί μια βιβλιογραφική επισκόπιση σχετικά με τα vector autoregressive (VAR) μοντέλα, δίνοντας έμφαση σε τεχνικές που σχετίονται με τη μέθοδο lasso. Οι τεχνικές που αναφέρονται, συμπεριλαμβάνουν την προσέγγιση που προτάθηκε από τους Hsu et al. (2008), η οποία είναι βασισμένη στη μέθοδο lasso, που προτάθηκε από τον Tibshirani (1996). Η μέθοδος των Wilms (2016), με τη χρήση του group lasso penalty (Yuan and Lin (2006)) αποτελεί βελτίωση της μεθόδου των Hsu et al. (2008). Περαιτέρω τεχνικές που χρησιμοποιούν το group lasso penalty αναφέρονται, όπως η προσέγγιση των Song and Bickel (2011), καθώς και τεχνικές που χρησιμοποιούν τη μέθοδο hierarchical group lasso, το οποίο εισήχθη από τους Jenatton et al. (2011). Η χρήση αυτής της μεθόδου, επιτρέπει την δημιουργία μιας νέας κατηγορίας μοντέλων, που ονομάζονται Hierarchical Lag (HLAG) μοντέλα και προτάθηκαν από τους Nicholson et al. (2020). Η συγκεκριμένη κατηγορία μοντέλων, δύναται να πραγματοποιήσει ταυτόχρονα μείωση της διάστασης του αρχικού μοντέλου, καθώς και επιλογή του κατάλληλου lag. Η ενσωμάτωση εξογενών μεταβλητών στο VAR μοντέλο, είναι ένα πολύ σημαντικό στοιχείο, καθώς σε πολλές περιπτώσεις η φύση των δεδομένων και του προβλήματος, απαιτεί την διαφοροποίηση των ενδογενών από τις εξογενείς μεταβλητές. Αυτή η κατηγορία μοντέλων, η οποία ονομάζεται VARX-L μοντέλα, προτάθηκε από τους Nicholson et al. (2017). Στο Κεφάλαιο 4, εφαρμόζονται τέσσερις VARX-L μέθοδοι (lasso, lag, sparse lag, own other), χρησιμοποιώντας δεδομένα που προέρχονται από διαφορετικά καταστήματα μιας αλυσίδας σουπερμάρκετ .για το χρονικό διάστημα Ιανουάριος 1993 μέχρι Ιούλιος 1994. Τα μοντέλα συγκρίνονται με βάση την MSFE τιμή τους, καθώς και το ποσοστό των συντελεστών που είναι 0, συνολικά αλλά και για τις ενδογενείς και εξωγενείς σειρές ξεχωριστά. Τέλος, γίνεται μια σύντομη βιβλιογραφική ανασκόπηση των MCP και SCAD πέναλτι (Zhang (2010); Fan and Li (2001) αντίστοιχα), ως πιθανές εναλλακτικές στο lasso πέναλτι. The aim of this project is to give an overview of the literature on shrinkage techniques regarding vector autoregressive (VAR) models, with focus on lasso based methods. The techniques discussed, include the approach proposed by Hsu et al. (2008), which is based on the lasso method proposed by Tibshirani (1996), the approach proposed by Wilms (2016), which improves Hsu et al. (2008) approach, utilizing the group lasso penalty (Yuan and Lin, 2006). More techniques that utilize the group lasso penalty were discussed, like Song and Bickel (2011), as well as the hierarchical group lasso penalty introduced by Jenatton et al. (2011). The use of the hierarchical group lasso penalty for performing shrinkage in vector autoregressive models, opens up a new class of models called Hierarchical Lag (HLAG) models (Nicholson et al., 2020), which perform simultaneously lag selection and dimension reduction. The incorporation of exogenous variables into the model, is a very important element when studying vector autoregressive models, since in many applications, the nature of the data and the problem, requires us to differentiate the effect of the endogenous from the exogenous variables. This topic is covered in this thesis, mainly by the work of Nicholson et al. (2017), who introduce the VARX-L framework. Moreover, in Chapter 4, four VARX-L methods (lasso, lag, sparse-lag, own-other) are implemented using marketing data from several stores of a grocery store chain for the time period from January 1993 to July 1994. The models are compared with respect to their MSFE values, as well as the percentage of coefficients that are shrunk to zero, both overall and for the endogenous and exogenous coefficients. Finally, a brief overview of MCP and SCAD penalties (Zhang (2010); Fan and Li (2001) respectively) as alternatives to the lasso penalty, is also made.
|
---|