Λογότυπο αποθετηρίου
 

Analysis of user ratings during 2000-2018 for Amazon's videogames for the development of a recommender system

Φόρτωση...
Μικρογραφία εικόνας

Ημερομηνία

2025-07-24

Συγγραφείς

Lakkas-Pyknis, Evangelos
Λάκκας-Πυκνής, Ευάγγελος

Τίτλος Εφημερίδας

Περιοδικό ISSN

Τίτλος τόμου

Εκδότης

Επιβλέποντα

Διαθέσιμο από

Περίληψη

Τα συστήματα συστάσεων στοχεύουν στον εντοπισμό ομοιοτήτων στις αξιολογήσεις των χρηστών και στη μετατροπή αυτών των ομοιοτήτων σε προτάσεις προϊόντων. Η παρούσα διπλωματική εργασία διερευνά δύο μεθοδολογίες που δοκιμάστηκαν σε δεδομένα αξιολογήσεων χρηστών-προϊόντων ενός εκτενούς συνόλου δεδομένων της Amazon για βιντεοπαιχνίδια: το k-medoids clustering το οποίο ομαδοποιεί τους χρήστες χρησιμοποιώντας την απόσταση Manhattan και το Singular Value Decomposition (SVD) που τοποθετεί και αντιστοιχεί τους χρήστες και τα προϊόντα σε έναν κοινό λανθάνοντα χώρο. Μετά από μια ιεραρχική διαίρεση του πίνακα αξιολογήσεων ανά κονσόλα και τύπο προϊόντος, η οποία αύξησε την πυκνότητα των δεδομένων και μείωσε τις διαστάσεις, και τα δύο μοντέλα εκπαιδεύτηκαν και δοκιμάστηκαν στους υποπίνακες που προέκυψαν. Το K-medoids εμφάνισε μικρότερο σφάλμα πρόβλεψης αξιολογήσεων, ενώ το SVD κατέταξε τα αντικείμενα με μεγαλύτερη ακρίβεια στη λίστα των 5 κορυφαίων κάνοντας πιο ακριβείς συστάσεις, αυτό αναδεικνύει μια αντιστάθμιση μεταξύ ακρίβειας πρόβλεψης και κατάταξης. Αν και τα δεδομένα συνεχίζουν να έχουν πολύ χαμηλή πυκνότητα, η ευελιξία του k-medoids και η συμπαγής δομή του SVD δείχνουν ότι η ακρίβεια και η υπολογιστική ταχύτητα μπορούν να επιτευχθούν ταυτόχρονα. Η εργασία καταλήγει πώς ο συνδυασμός αυτών των προσεγγίσεων—σε συνδυασμό με την αξιοποίηση επιπρόσθετων πληροφοριών και δεδομένων—θα μπορούσε να ενισχύσει περαιτέρω την απόδοση σε πραγματικούς, μεγάλης κλίμακας καταλόγους προϊόντων στο μέλλον.
Recommender systems aim to detect likeness in user-rating patterns and turn those similarities into product suggestions. This thesis explores two data-driven ways to uncover such structure based on user-item ratings obtained from a large Amazon Video-Games corpus: k-medoids clustering, which groups users around real-user prototypes using Manhattan distance, and low-rank Singular Value Decomposition (SVD), which maps users and items into a shared latent space. After a hierarchical split of the rating matrix by console and product type which reduced sparsity and dimensionality, both models are trained and tested on the resulting sub-matrices. K-medoids delivers the smaller rating error, while SVD ranks items more precisely in the top-5 list, illustrating a prediction-versus-ranking trade-off. Although the data remain extremely sparse, the flexibility of k-medoids and the compactness of SVD show that accuracy and run-time scalability can be jointly achieved. The work outlines how hybridizing these approaches—and adding side information—could further improve performance on real-world, large-scale catalogues.

Περιγραφή

Λέξεις-κλειδιά

Reccomendation system, Matrix factorization, Clustering, Συστήμα συστάσεων, Παραγοντοποίηση πινάκων, Ομαδοποίηση

Παραπομπή