Περίληψη : | Τα κρυπτομαρκοβιανά μοντέλα είναι στατιστικά μοντέλα στα οποία η διαδικασία που θέλουμε να μοντελοποιήσουμε είναι μία Μαρκοβιανή αλυσίδα με μη παρατηρήσιμες (κρυμμένες) καταστάσεις. Τα μοντέλα αυτά έχουν εφαρμοσθεί σε ποικίλους κλάδους, συμπεριλαμβανομένης της επεξεργασίας σημάτων, της οικονομίας και της οικολογίας, και ξεχωρίζουν για την ευελιξία τους και την υπολογιστική τους αποδοτικότητα. Οι καταστάσεις των κρυπτομαρκοβιανών μοντέλων είναι διακριτές τυχαίες μεταβλητές και δείχνουν τις μεταβάσεις της μεταβλητής που μελετάμε από τη μία χρονική στιγμή στην άλλη. Ωστόσο μπορεί να υπάρχουν πλεονεκτήματα στην πράξη υποθέτοντας πως οι καταστάσεις αυτές είναι συνεχείς. Αυτά τα μοντέλα είναι γνωστά ως μοντέλα χώρου-καταστάσεων και έχουν ακριβώς την ίδια δομή με κρυπτομαρκοβιανά μοντέλα. Ωστόσο, η πιθανοφάνεια των μοντέλων αυτών δεν μπορεί να υπολογισθεί απευθείας. Η παρούσα διπλωματική εργασία εξετάζει την χρήση της αποτελεσματικής μεθοδολογίας των κρυπτομαρκοβιανών μοντέλων ώστε να εφαρμόσει μοντέλα χώρου καταστάσεων. Για να αναδείξουμε αυτά τα μοντέλα θα χρησιμοποιήσουμε μετρήσιμα διακριτά δεδομένα πωλήσεων ενός συγκεκριμένου σαπουνιού σε σούπερ μάρκετ. Ξεκινάμε εφαρμόζοντας ένα Poisson κρυπτομαρκοβιανό μοντέλο όπου το πλήθος των καταστάσεων καθορίζεται από την επιλογή του κατάλληλου μοντέλου, κατόπιν εφαρμογής και σύγκρισης. Στη συνέχεια θεωρούμε συνεχές μοντέλο χώρου καταστάσεων για τα δεδομένα το οποίο εφαρμόζουμε χρησιμοποιώντας δύο εφαρμογές κρυπτομαρκοβιανών μοντέλων όπου κύριο χαρακτηριστικό τους, είναι η διαφορετική προσέγγιση όσο αναφορά τον υπολογισμό του πινάκα μετάβασης. Διερευνούμε την επιλογή των παραμέτρων σε κάθε προσέγγιση και χρησιμοποιούμε το βέλτιστο αποτέλεσμα για εκτίμηση και πρόβλεψη. Ενδεικτικά απλώς θα αναφέρουμε μεθόδους ομαδοποίησης (clustering) οι οποίες θα μπορούσαν να μας φανούν χρήσιμες προτού ξεκινήσουμε την ανάλυση μας ώστε να έχουμε μια εικόνα ενός ικανοποιητικού διαχωρισμού των δεδομένων μας. Τέλος, συγκρίνουμε τα μοντέλα στα οποία είχαμε προαναφερθεί, χρησιμοποιώντας τα απαραίτητα κριτήρια και καταλήγοντας στο ποιό εν τέλη θα ήταν καταλληλότερο για τα συγκεκριμένα δεδομένα όπως και ποιο είναι το γενικό αντικειμενικό μας συμπέρασμα. A hidden Markov model (HMM) is a statistical model in which the system being modelled is assumed to be a Markov process with unobservable (i.e. hidden) states. HMMs have been employed in a variety of areas, including signal processing, finance and ecology, and are noted for their flexibility and computational efficiency. The state process of a HMM is discrete-valued but there may be advantages in practice in assuming a continuous state. Such models are known as state-space models (SSMs),and have exactly the same dependence structure as HMMs. However, the likelihood of a SSM cannot be evaluated directly in general. This thesis considers the use of efficient HMM methodology to fit general SSMs. We illustrate the approach using a real data set on weekly sales of a particular soap product in a supermarket. We start by applying a Poisson HMM where the number of states is determined by model-selection. We then consider a continuous-valued SSM for the data,which we fit using two HMM implementations, where their main difference lies on the calculation ofthe transition probability matrix. We investigate the choice of discretisation parameters within each approach, and use the optimal settings for estimation and forecasting.In addition, we mention some clustering methods that might seem useful on having a better picture of a satisfactory separation of our data. Finally, we compare the models mentioned above using information criteria, ending up on which would be most appropriate, for the given data, and then draw our overall objective conclusion.
|
---|