Abstract : | A hidden Markov model (HMM) is a statistical model in which the system being modelled is assumed to be a Markov process with unobservable (hidden) states. HMMs have found application in a wide variety of disciplines, ranging from signal processing and engineering to finance and the environment. Typically the underlying Markov process in a HMM is assumed to be first-order. We consider the use of higher-order HMMS accommodating longer-range Markov dependence. We focus on second-order dependence, and employ an approach that transforms a second-order HMM into an equivalent first-order. The approach is general to any order, and opens the way to estimating higher order HMMs using standard techniques for first-order models. Despite the theoretical appeal of higher-order HMMs, their larger number of parameters can be detrimental to their performance in practice. We explore this issue, illustrating their practical utility using real world applications. In the first application we consider a binary time-series based on the Old Faithful geyser data. We fit first-and second-order HMMs and choose between them using information criteria. In the second application we consider a famous count time series reflecting the annual number of major earthquakes that happened globally between1900 and 2006. We fit first-and second-order HMMs when the state distribution, the number of latent states, and the nature of the serial dependence, including the true order, are unknown. Because of the highly increasing number of parameters, we explore parameter reduction through fitting mixture transition distribution (MTD) models, which allow second-order dependence, but use less parameters. We compare different models and specifications using information criteria to choose which models fits better the data. Finally, we perform a simulation study using the earthquakes data set, comparing first- and second-order HMMs and MTD- second order HMMs. We conclude that there are differences between the estimated parameters of these models. ΄Ενα κρυπτομαρκοβιανό μοντέλο (ΗΜΜ) είναι ένα στατιστικό μοντέλο στο οποίο το σύστημα που διαμορφώνεται θεωρείται μια διαδικασία Markov με μη-παρατηρήσιμες (κρυφές) καταστάσεις. Τα HMMs εφαρμόζονται σε πολλούς κλάδους, συμπεριλαμβανομένης της επεξεργασίας σημάτων, της μηχανικής και της χρηματοδότησης. Συνήθως η υποκείμενη διαδικασία Markov ενός ΗΜΜ θεωρείται ότι είναι πρώτης τάξεως. Εξετάζουμε τη χρήση HMMs υψηλότερης τάξης που παρέχει υψηλότερη εξάρτηση Markov. Εστιάζουμε στην εξάρτηση δεύτερης τάξης και εφαρμόζουμε μια προσέγγιση που μετατρέπει ένα ΗΜΜ δεύτερης τάξης σε μοντέλο πρώτης τάξης. Η προσέγγιση είναι γενική σε οποιαδήποτε τάξη μοντέλου και ανοίγει το δρόμο για την εκτίμηση των HMMs υψηλότερης τάξης χρησιμοποιώντας τυπικές τεχνικές για μοντέλα πρώτης τάξης. Παρά το θεωρητικό γόητρο των HMMs υψηλότερης τάξης, ο μεγαλύτερος αριθμός παραμέτρων τους μπορεί να είναι επιζήμιος για την απόδοσή τους στην πράξη. Διερευνούμε αυτό το ζήτημα και παρουσιάζουμε την χρησιμότητά τους χρησιμοποιώντας εφαρμογές με πραγματικά δεδομένα. Στην πρώτη εφαρμογή εξετάζουμε μια δυαδική χρονικοσειρά βασισμένη στα δεδομένα old faithful geyser. Εφαρμόζουμε HMMs πρώτης και δεύτερης τάξης και επιλέγοντας το καλύτερο χρησιμοποιώντας κριτήρια πληροφόρησης. Στη δεύτερη εφαρμογή εξετάζουμε μια διάσημη χρονοσειρά με διακριτές τιμές που αντικατοπτρίζει τον ετήσιο αριθμό μεγάλων σεισμών που συνέβησαν παγκοσμίως μεταξύ 1900-2006. Δημιουργούμε HMMs πρώτης και δεύτερης τάξης όταν η κατανομή των καταστάσεων της αλυσίδας Markov, ο αριθμός των λανθάνουσων καταστάσεων και ο τύπος της εξάρτησης της χρονοσειράς, συμπεριλαμβανομένης της πραγματικής τάξης, είναι άγνωστα. Λόγω του αυξανόμενου αριθμού παραμέτρων, διερευνούμε τη μείωση παραμέτρων μέσω της προσαρμογής μοντέλων mixture transition distribution (MTD), που επιτρέπουν την εξάρτηση δεύτερης τάξης, αλλά χρησιμοποιούν λιγότερες παραμέτρους. Συγκρίνουμε διαφορετικά μοντέλα χρησιμοποιώντας κριτήρια πληροφόρησης για να επιλέξουμε ποια μοντέλα ταιριάζουν καλύτερα στα δεδομένα. Τέλος, πραγματοποιούμε μια μελέτη προσομοίωσης χρησιμοποιώντας τον αριθμό των σεισμών, συγκρίνοντας HMMs πρώτης και δεύτερης τάξης καθώς και MTD μοντέλα με ΗΜΜ δεύτερης τάξης. Καταλήγουμε στο συμπέρασμα πως τα μοντέλα αυτά δεν έχουν την ίδια συμπεριφορά.
|
---|