Bayesian modelling of volleyball data
Ημερομηνία
06/21/2019
Συγγραφείς
Palaskas, Vasileios I.
Παλάσκας, Βασίλειος Ι.
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Επιβλέπων
Διαθέσιμο από
2019-07-10 19:47:18
Περίληψη
Σε αυτή την διπλωματική, εμείς επικεντρωνόμαστε στο "χτίσιμο" Μπεϋζιανών μοντέλων για να αναλύσουμε ένα σετ δεδομένων του Βόλεϊ. Πιο συγκεκριμένα, η πρώτη και πιο σημαντική πρόκληση είναι να βρούμε τα κατάλληλα μοντέλα για την μεταβλητή απόκρισης της διαφοράς των σετ. Τα μοντέλα δεν μπορούν να είναι τα συνηθισμένα της Poisson και της διωνυμικής κατανομής, τα οποία χρησιμοποιούνται συνήθως για τα άλλα ομαδικά αθλήματα. Tα μοντέλα που προτείνουμε εδώ θα χρησιμοποιηθούν τόσο για την περιγραφή και κατανόηση του αθλήματος όσο και για την πρόβλεψη. Έτσι, ενώ αρχικά θα ελέγξουμε την προσαρμογή των δύο συνηθισμένων μοντέλων στα ομαδικά αθλήματα, στην συνέχεια θα προχωρήσουμε στην ανάπτυξη και εφαρμογή μοντέλων που θα λαμβάνουν υπόψιν τους τα ειδικά χαρακτηριστικά του παιχνιδιού. Έτσι, πρώτα από όλα, το μοντέλο στο οποίο θα επικεντρωθούμε είναι ένα μοντέλο βασισμένο στην κατανομή Skellam (or Poisson difference) για τη διαφορά των σετ ως εξαρτημένη μεταβλητή. Στην ουσία, θα προσπαθήσουμε να προσαρμόσουμε την κατανομή Skellam ώστε να λάβουμε υπόψιν τους κανόνες του αθλήματος. Πιο συγκεκριμένα, δεδομένου της μη ύπαρξης ισοπαλιών και του ότι η ομάδα που κερδίζει τον αγώνα κερδίζει τον αγώνα με μέγιστο αριθμό νικηφόρων σετ 3 στους αγώνες, χρειαζόμαστε να επεκτείνουμε το μοντέλο ώστε να αντιμετωπίσουμε τα παραπάνω ζητήματα. Μία άλλη κατηγορία μοντέλων που χρησιμοποιείται πρώτα σε αυτή την εργασία είναι τα πολυωνυμικά και διατάξιμα πολυωνυμικά μοντέλα με την ίδια εξαρτημένη μεταβλητή (διαφορά των σετ). Όσον αφορά τις επεξηγηματικές μεταβλητές, αρχικά προσαρμόζουμε και συγκρίνουμε τα μοντέλα με την κοινή επίδραση της έδρας και τις επιθετικές καθώς και αμυντικές ικανότητες των εντός και εκτός έδρας ομάδων. Σε δεύτερο στάδιο, θα προσαρμόσουμε μοντέλα με καταγεγγραμένες δεξιότητες ως επεξηγηματικές μεταβλητές όπως το σερβίς, το μπλοκ μεταξύ άλλων. Αυτό θα γίνει συμπεριλαμβάνοντας μοντέρνες τεχνικές Μπεϋζιανής επιλογής μεταβλητών. Με αυτό τον τρόπο επίσης θα εφαρμόσουμε Μπεϋζιανή στάθμιση των μοντέλων. Μέσω των διαγνωστικών των μοντέλων θα γίνει έλεγχος καλής προσαρμογής και για τις δύο περιπτώσεις των μοντέλων χωρίς δεξιότητες (πολυωνυμικά και Skellam). Η Μπεϋζιανή σύγκριση μοντέλων θα γίνει πρώτα μέσω των κριτηρίων πληροφορίας για όλα τα μοντέλα της ίδιας κατανομής με και χωρίς τις δεξιότητες (ως επιπρόσθετες μεταβλητές) ώστε να αποφασίσουμε αν η ενσωμάτωση των δεξιοτήτων ως (επιπρόσθετες) μεταβλητές στα ήδη υπάρχοντα μοντέλα (με τις συνηθισμένες ομαδικές ικανότητες) βελτιώνουν ή όχι την προβλεπτική απόδοση των μοντέλων. Στην συνέχεια, η Μπεϋζιανή σύγκριση μοντέλων θα γίνει μέσω άλλων μεθόδων μεταξύ όλων των μοντέλων χωρίς τις δεξιότητες (ως επεξηγηματικές μεταβλητές).Όσον αφορά την καλή προσαρμογή των μοντέλων χωρίς δεξιότητες (ως επεξηγηματικές μεταβλητές), το διατάξιμο πολυωνυμικό μοντέλο και το μοντέλο βασισμένο στην Skellam κατανομή έχουν την καλύτερη απόδοση. Η ενσωμάτωση των δεξιοτήτων βελτιώνει την προβλεπτική απόδοση τόσο του διατάξιμου μοντέλου όσο και των μοντέλων που βασίζονται στην Skellam κατανομή, σύμφωνα με τα κριτήρια πληροφορίας. Τέλος, το διατάξιμο πολυωνυμικό μοντέλο και το μοντέλο βασισμένο στην Skellam κατανομή έχουν την καλύτερη προβλεπτική απόδοση, σύμφωνα με άλλες μεθόδους αξιολόγησης της προβλεπτικής απόδοσης των μοντέλων.
Περιγραφή
Λέξεις-κλειδιά
Volleyball data, Bayesian modelling, Bayesian variable selection, Prediction, Δεδομένα βόλεϊ, Μπεϋζιανή μοντελοποίηση, Μπεϋζιανή επιλογή μεταβλητών, Πρόβλεψη