PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :Bayesian modelling of volleyball data
Alternative Title :Μπεϋζιανή μοντελοποίηση σε δεδομένα βόλεϊ
Creator :Palaskas, Vasileios I.
Παλάσκας, Βασίλειος Ι.
Contributor :Ntzoufras, Ioannis (Επιβλέπων καθηγητής)
Karlis, Dimitris (Εξεταστής)
Repousis, Panagiotis (Εξεταστής)
Athens University of Economics and Business, Department of Statistics (Degree granting institution)
Type :Text
Extent :xx, 158 p.
Language :en
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=7098
Abstract :Σε αυτή την διπλωματική, εμείς επικεντρωνόμαστε στο "χτίσιμο" Μπεϋζιανών μοντέλων για να αναλύσουμε ένα σετ δεδομένων του Βόλεϊ. Πιο συγκεκριμένα, η πρώτη και πιο σημαντική πρόκληση είναι να βρούμε τα κατάλληλα μοντέλα για την μεταβλητή απόκρισης της διαφοράς των σετ. Τα μοντέλα δεν μπορούν να είναι τα συνηθισμένα της Poisson και της διωνυμικής κατανομής, τα οποία χρησιμοποιούνται συνήθως για τα άλλα ομαδικά αθλήματα. Tα μοντέλα που προτείνουμε εδώ θα χρησιμοποιηθούν τόσο για την περιγραφή και κατανόηση του αθλήματος όσο και για την πρόβλεψη. Έτσι, ενώ αρχικά θα ελέγξουμε την προσαρμογή των δύο συνηθισμένων μοντέλων στα ομαδικά αθλήματα, στην συνέχεια θα προχωρήσουμε στην ανάπτυξη και εφαρμογή μοντέλων που θα λαμβάνουν υπόψιν τους τα ειδικά χαρακτηριστικά του παιχνιδιού. Έτσι, πρώτα από όλα, το μοντέλο στο οποίο θα επικεντρωθούμε είναι ένα μοντέλο βασισμένο στην κατανομή Skellam (or Poisson difference) για τη διαφορά των σετ ως εξαρτημένη μεταβλητή. Στην ουσία, θα προσπαθήσουμε να προσαρμόσουμε την κατανομή Skellam ώστε να λάβουμε υπόψιν τους κανόνες του αθλήματος. Πιο συγκεκριμένα, δεδομένου της μη ύπαρξης ισοπαλιών και του ότι η ομάδα που κερδίζει τον αγώνα κερδίζει τον αγώνα με μέγιστο αριθμό νικηφόρων σετ 3 στους αγώνες, χρειαζόμαστε να επεκτείνουμε το μοντέλο ώστε να αντιμετωπίσουμε τα παραπάνω ζητήματα. Μία άλλη κατηγορία μοντέλων που χρησιμοποιείται πρώτα σε αυτή την εργασία είναι τα πολυωνυμικά και διατάξιμα πολυωνυμικά μοντέλα με την ίδια εξαρτημένη μεταβλητή (διαφορά των σετ). Όσον αφορά τις επεξηγηματικές μεταβλητές, αρχικά προσαρμόζουμε και συγκρίνουμε τα μοντέλα με την κοινή επίδραση της έδρας και τις επιθετικές καθώς και αμυντικές ικανότητες των εντός και εκτός έδρας ομάδων. Σε δεύτερο στάδιο, θα προσαρμόσουμε μοντέλα με καταγεγγραμένες δεξιότητες ως επεξηγηματικές μεταβλητές όπως το σερβίς, το μπλοκ μεταξύ άλλων. Αυτό θα γίνει συμπεριλαμβάνοντας μοντέρνες τεχνικές Μπεϋζιανής επιλογής μεταβλητών. Με αυτό τον τρόπο επίσης θα εφαρμόσουμε Μπεϋζιανή στάθμιση των μοντέλων. Μέσω των διαγνωστικών των μοντέλων θα γίνει έλεγχος καλής προσαρμογής και για τις δύο περιπτώσεις των μοντέλων χωρίς δεξιότητες (πολυωνυμικά και Skellam). Η Μπεϋζιανή σύγκριση μοντέλων θα γίνει πρώτα μέσω των κριτηρίων πληροφορίας για όλα τα μοντέλα της ίδιας κατανομής με και χωρίς τις δεξιότητες (ως επιπρόσθετες μεταβλητές) ώστε να αποφασίσουμε αν η ενσωμάτωση των δεξιοτήτων ως (επιπρόσθετες) μεταβλητές στα ήδη υπάρχοντα μοντέλα (με τις συνηθισμένες ομαδικές ικανότητες) βελτιώνουν ή όχι την προβλεπτική απόδοση των μοντέλων. Στην συνέχεια, η Μπεϋζιανή σύγκριση μοντέλων θα γίνει μέσω άλλων μεθόδων μεταξύ όλων των μοντέλων χωρίς τις δεξιότητες (ως επεξηγηματικές μεταβλητές).Όσον αφορά την καλή προσαρμογή των μοντέλων χωρίς δεξιότητες (ως επεξηγηματικές μεταβλητές), το διατάξιμο πολυωνυμικό μοντέλο και το μοντέλο βασισμένο στην Skellam κατανομή έχουν την καλύτερη απόδοση. Η ενσωμάτωση των δεξιοτήτων βελτιώνει την προβλεπτική απόδοση τόσο του διατάξιμου μοντέλου όσο και των μοντέλων που βασίζονται στην Skellam κατανομή, σύμφωνα με τα κριτήρια πληροφορίας. Τέλος, το διατάξιμο πολυωνυμικό μοντέλο και το μοντέλο βασισμένο στην Skellam κατανομή έχουν την καλύτερη προβλεπτική απόδοση, σύμφωνα με άλλες μεθόδους αξιολόγησης της προβλεπτικής απόδοσης των μοντέλων.
Table of Contents :In this thesis, we focus on building Bayesian models to analyze a Volleyball data set. More specifically, we focus on the identification of models for the response outcome of set difference which can be not based on the usual Poisson or Binomial assumptions. The fitted model will be used not only for game interpretation but also for prediction. So we will firstly check the fit of the two models routinely used in other competitive sports (Poisson, binomial). However, we will further focus on other models due to the nature of our response data. First of all, the model of our primary focus is one based on the Skellam distribution and its adaptations which try to incorporate the special characteristics of Volleyball. In essence, we will try to adjust the Skellam (or Poisson Difference) distribution in order to take into account the rules of this sport. In light of the non existence of draws and that the winning team has maximum 3 sets in volleyball games, we need to extend this model in order to deal with these issues. We will also use multinomial and ordinal models with the same response variable (set difference). As far as the futures of the game are concerned, at first we fit models by using only a common home effect and the usual attacking and defending abilities of teams for both competing Skellam and multinomial based models. In the second level we will consider models with recorded skills as variables such as the serve, block among others. This will be implemented by incorporating modern Bayesian variable selection techniques. By this way also we implement automatically Bayesian model averaging. Goodness-of-fit will be implemented through model diagnostics for both models without skills (based on multinomial family and Skellam distribution). The Bayesian model comparison will be firstly implemented via the information criteria in the models with and without skills (as covariates) in order to decide whether the inclusion of skills as covariates increases or not the predictive performance of already fitted models (with usual team abilities). Afterwards, the Bayesian model comparison will be implemented via other cross validation methods only in all models without skills.Concerning the fitting accuracy of models without skills, the ordered logistic and the truncated version of Skellam have the best performance. The incorporation of skills in both ordered logistic and Skellam based models improves the predictive accuracy of these models, according to the information criteria. Last but not least, the ordered logistic model and the truncated version of Skellam without skills have the best out-of-sample predictive accuracy, according to other cross validation methods.
Subject :Volleyball data
Bayesian modelling
Bayesian variable selection
Prediction
Δεδομένα βόλεϊ
Μπεϋζιανή μοντελοποίηση
Μπεϋζιανή επιλογή μεταβλητών
Πρόβλεψη
Date Available :2019-07-10 19:47:18
Date Issued :06/21/2019
Date Submitted :2019-07-10 19:47:18
Access Rights :Free access
Licence :

File: Palaskas_2019.pdf

Type: application/pdf