Περίληψη : | Τα δεδομένα περιήγησης περιλαμβάνουν σημαντική πληροφορία σε σχέση με τη συμπεριφορά περιήγησης του χρήστη σε μία ηλεκτρονική ιστοσελίδα. Σε αυτή τη μελέτη προτείνεται ένα Μαρκοβιανό μοντέλο συνεχούς χρόνου για τη μοντελοποίηση των δεδομένων. Οι σελίδες στα δεδομένα περιήγησης κατηγοριοποιούνται με βάση το περιεχόμενο τους. Οι κατηγορίες αυτές είναι οι καταστάσεις στο μοντέλο. Η ακολουθία αυτή των καταστάσεων για μια συγκεκριμένη επίσκεψη γίνεται η αλυσίδα. Με βάση τη θεωρία του Άλμπερτ υπολογίστηκε ο γεννήτορας πίνακας και ομαδοποιήσαμε τα δεδομένα με μεικτό μοντέλο Μάρκοβ συνεχούς χρόνου.Το βασικό μας εργαλείο είναι ο αλγόριθμος ΕΜ. Clickstream data contain important information about user's browsing behavioron a website. In this study, a Markov model, more specifically theContinuous Time Finite State Markov Chain (CTMC) is proposed to modelthe data. The pages in the clickstream data are categorized based on theircontent. These categories become the user-states in the model. The sequenceof states for a particular visit by a user (session) becomes the chain. Usingreal data data and the CTMC model developed by Albert, the Q matrix iscalculated (Albert et al. [1962]). This Q matrix is then used to calculate theprobability of a user's next movement on the website. We show how pathinformation can be categorized and modeled using a mixture of first orderCTMC model. By using this model, we perform model based clustering andwe group our data. The basic tool for this aggregation method is the EMalgorithm.
|
---|