Περίληψη : | Τα τελευταία χρόνια έχει παρατηρηθεί ότι οι επισκέψεις των διαδικτυακών τόπων αποκτούν προστιθέμενη αξία, η οποία δεν οφείλεται στον όγκο της πληροφορίας που μπορεί να βρει κανείς μέσα σε ένα ιστότοπο, αλλά στην ευκολότερη πρόσβαση σε απαιτούμενες πληροφορίες την κατάλληλη στιγμή και με την καταλληλότερη μορφή. Επομένως, η ανάλυση της συμπεριφοράς των χρηστών στο Διαδίκτυο αποτελεί πλέον ένα σημαντικό θέμα, καθώς η εστίαση σε συγκεκριμένες ατομικές ανάγκες και η παροχή προσαρμοσμένων προϊόντων και υπηρεσιών αποτελεί το κινητήριο μοχλό για τη δημιουργία ξεχωριστών υπηρεσιών με ολοένα αυξανόμενη προστιθέμενη αξία.Λόγω της μεγάλης πληθώρας πληροφοριών στο Διαδίκτυο, τέθηκε η ανάγκη δημιουργίας συστημάτων που παρέχουν υπηρεσίες χαρακτηρισμού, αναζήτησης και ανάκτησης των πόρων που διαθέτουν, μέσω κοινωνικών επισημειώσεων. Για το σκοπό αυτό, δημιουργήθηκαν πλήρη σύνολα επισημειώσεων, βιβλιογραφικά καλούμενα ως κοινωνικές ταξονομίες, τα οποία χρησιμοποιούν οι χρήστες ενός συστήματος διαχείρισης διαμοιραζόμενου περιεχομένου σε ορισμένα κομμάτια του περιεχομένου, με σκοπό να τα ομαδοποιήσουν ή να τα ταξινομήσουν για μελλοντική ανάκτηση. Τα περισσότερα από αυτά τα συστήματα είναι προσβάσιμα από όλους και συνήθως δεν υπάρχει μηχανισμός καταγραφής της ταυτότητας του χρήστη, καθιστώντας την ανάλυση της συμπεριφοράς των χρηστών μια τεχνικά δύσκολη και επίπονη διαδικασία.Η παρούσα μελέτη μελετά τη χρησιμότητα της κατασκευής κοινοτήτων χρηστών με πανομοιότυπα πρότυπα συμπεριφοράς χρήσης, μέσω της χρήσης αλγορίθμων εξόρυξης γνώσης. Συγκεκριμένα, για την εκπόνιση αυτής της εργασίας απαιτείται η επεξεργασία αρχείων καταγραφής (log files) ενός εξυπηρετητή του παγκόσμιου ιστού που παρέχει τη δυνατότητα χαρακτηρισμού των πόρων που διαθέτει, μέσω κοινωνικών επισημειώσεων. Απώτερος στόχος της επεξεργασίας είναι ο προσδιορισμός ομάδων χρηστών που χρησιμοποιούν κοινές επισημειώσεις για την αναζήτηση και ανάκτηση πόρων, δηλαδή τα μέλη τους παρουσιάζουν παρόμοια συμπεριφορά χρήσης και διαθέτουν κοινά ενδιαφέροντα. Σημαντική έμφαση δίνεται στην Web Usage Mining διαδικασία που αποτελεί τη θεμέλιο λίθο για το σχηματισμό κοινοτήτων χρηστών. Η ανάλυση και η παρουσίαση όλων των σταδίων της διαδικασίας αυτής αποτελεί τη μεθοδολογία που χρησιμοποιείται στις δυο μελέτες περίπτωσης που παρουσιάζονται στην παρούσα εργασία. Συνοπτικά, τα σταδία αυτά αφορούν στην εκκαθάριση των αρχείων καταγραφής (data cleaning), στον εντοπισμό ενεργειών των χρηστών (user sessions) που αναφέρονται στην αναζήτηση πληροφοριών με τη χρήση κοινωνικών επισημειώσεων, στην μετατροπή των επεξεργασμένων δεδομένων χρήσης σε χαρακτηριστικά, στην επιλογή και εκτέλεση αλγόριθμου εξόρυξης γνώσης για το σχηματισμό κοινοτήτων χρηστών και στην αξιολόγηση των κοινοτήτων που δημιουργήθηκαν. Ο αλγόριθμος εξόρυξης γνώσης που χρησιμοποιείται στη συγκεκριμένη μελέτη είναι ένας cluster mining αλγόριθμος. Σκοπός των δύο μελετών περίπτωσης, είναι η δημιουργία μοντέλων κοινοτήτων με κοινά χαρακτηριστικά. Συγκεκριμένα στην πρώτη μελέτη, σχηματίστηκαν κοινότητες από κοινωνικές επισημειώσεις χρηστών, ενώ στην δεύτερη μελέτη σχηματίστηκαν κοινότητες από ενέργειες χρηστών (user sessions) που αναφέρονται στην αναζήτηση πληροφοριών με τη χρήση κοινωνικών επισημειώσεων. Επομένως, και στις δυο περιπτώσεις τα μοντέλα κοινοτήτων αφορούν ομάδες χρηστών με κοινά ενδιαφέροντα και παρόμοια συμπεριφορά χρήσης κατά την αλληλεπίδραση τους με το σύστημα. Επίσης, παρουσιάζονται δύο μετρικές που αφορούν στην κάλυψη και μοναδικότητα (coverage, distinctiveness) των αποτελεσμάτων εξόρυξης, που αποτελούν αντικειμενικά κριτήρια αξιολόγησης των μοντέλων κοινοτήτων που σχηματίζονται, καθώς και βασικό κριτήριο επιλογής του καταλληλότερου μοντέλου για την κάθε μελέτη περίπτωσης ξεχωριστά.Συνοψίζοντας, η αξιολόγηση των κοινοτήτων που σχηματίζονται κατά την εκτέλεση των πειραμάτων, αποτελεί βασικό ζήτημα της συγκεκριμένης μελέτης, καθώς η χρήση και η ανάλυση αντιπροσωπευτικών και «κατανοητών» κοινοτήτων χρηστών αντικατοπτρίζει σχεδόν πλήρως τις ανάγκες και τα ενδιαφέροντα κάθε τύπο χρήστη μέσα σε μια εφαρμογή.
|
---|