Περίληψη : | The goal of this thesis is to build a model that can estimate point spread in Euroleague basketball game using data from 2018-2019 season. We will use advanced statistics described by Kubatko et al. (2007) and Dean Oliver (2004) against box score statistics to explain the variation of point spread and compare the results. Forward and backward elimination methods for variable selection were used for both models. Model that uses advanced statistics as independent variables proved to be more effective by explaining 97% of point spread variation against 93.27% of model using box score statistics. Moreover, first model proved to be more “parsimonious” by using three instead of seven variables.Furthermore, we will try to fit the model used by Dean Oliver (2004) to describe the number of wins in NBA, for Euroleague level. We will find evidence that discrepancy in budget level of Euroleague teams affects the number of wins and quality characteristics such as, quality of shooting.Additionally, home court advantage and crowd effect will be examined. Findings show that home court advantage exists and should be considered part of the point spread model. Home teams tend to be significantly better, in vast majority of, variables positively related with game outcome. The above advantage decreases with the absence of fans, but this change proves to be insignificant in most cases. Finally, we examined our point spread model in terms of prediction compared to outcome of each game. As statistics are unknown prior to the game we used seasonal average, moving average and weighted average for each team. Our results showed an overestimation for teams that proved to be efficient in shooting. Ο στόχος αυτής της διατριβής είναι να δημιουργήσει ένα μοντέλο που μπορεί να εκτιμήσει την διαφορά πόντων στο παιχνίδι του μπάσκετ, χρησιμοποιωντας δεδομενα απο τη σεζον 2018-2019 της Euroleague. Θα χρησιμοποιήσουμε προηγμένα στατιστικά στοιχεία που περιγράφονται από τους Kubatko et al. (2007) και Dean Oliver (2004) σε σχέση με τα στατιστικά στοιχεία που προκύπτουν σε απόλυτους αριθμούς απ’ το φύλλο αγώνα για να εξηγήσουμε τη διακύμανση της διαφοράς των πόντων. Μεσω forward και backward elimination μεθόδους επιλογής μεταβλητών θα καταληξουμε σε δύο μοντέλα, με αυτο που χρησιμοποιει τα αναλυτικα στατιστικα να αποδεικνυεται καλυτερο, εξηγωντας 97% της διακυμανσης της διαφορας των ποντων, εναντι στο 93.27% του έτερου μοντέλου. Επιπρόσθετα, το ιδιο μοντελο αποδεικνύεται και πιο «οικονομικό», καθως χρησιμοποιει τρείς αντι για εφτά μεταβλητέςΕπιπλέον, θα προσπαθήσουμε να προσαρμόσουμε το μοντέλο που χρησιμοποίησε ο Dean Oliver (2004) για να περιγράψει τον αριθμό των νικών στο NBA, για το επίπεδο της Ευρωλίγκα. Θα βρούμε αποδεικτικά στοιχεία ότι η απόκλιση στο επίπεδο του προϋπολογισμού των ομάδων της Ευρωλίγκας επηρεάζει τον αριθμό των νικών και ποιοτικά χαρακτηριστικά, οπως την ικανότητα στο σουτ.Επιπλέον, θα εξεταστεί το πλεονέκτημα έδρας και η επίδραση της πανδημίας Covid-19. Τα ευρήματα δείχνουν ότι το πλεονέκτημα έδρας υπάρχει και πρέπει να θεωρηθεί μέρος του προαναφερθέν μοντέλου. Οι γηπεδούχοι τείνουν να είναι καλύτεροι στις περισσοτερες μεταβλητές που ειναι συνδεδεμένες με το τελικο αποτέλεσμα. Το παραπάνω πλεονέκτημα μειώνεται με την απουσία οπαδών στις κερκίδες, αλλά αυτή η αλλαγή αποδεικνύεται στατιστικά ασήμαντη σε επιπεδο 95%.Τέλος, εξετάζουμε την προβλεπτική ικανότητα του μοντέλου μας σε σύγκριση με το τελικό αποτέλεσμα του κάθε αγώνα. Χρησιμοποιήσαμε τον μέσο όρο της συνολικής χρονιάς, τον κινούμενο μέσο όρο και τον σταθμισμένο μέσο όρο για κάθε ομάδα. Τα αποτελέσματα δείχνουν να υπερεκτιμούν τις ομάδες με μεγάλη ικανότητα στον τομέα του σούτ.
|
---|