Abstract : | Στόχος αυτής της διπλωματικής εργασίας είναι να εκτιμηθεί η επιθετική και αμυντική συνεισφορά των παικτών του ΝΒΑ στις ομάδες τους. Όπως είπε ο Dean Oliver, ένας από τους σημαντικότερους ανθρώπους στη στατιστική ανάλυση στην καλαθοσφαίριση, "Η ομαδική εργασία είναι το στοιχείο του μπάσκετ που είναι πιο δύσκολο να συλληφθεί με οποιαδήποτε ποσοτική έννοια" (“Basketball on Paper”, 2004). Ο Rosenbaum, D. T., (2004) εμπνεύστηκε από αυτό το απόσπασμα - και αργότερα Ilardi, S., και Barzilai, A., (2008)- πρότειναν ένα Ridge μοντέλο γραμμικής παλινδρόμησης για την εκτίμηση της συνεισφοράς των παικτών χρησιμοποιώντας μόνο την πληροφορία για τους συμπαίκτες και τους αντιπάλους τους στο γήπεδο. Ο δείκτης ονομάστηκε Regularized Adjusted Plus / Minus (RAPM).Αρχικά, θα δούμε ότι οι παίκτες με λίγο χρόνο συμμετοχής δεν πρέπει να λαμβάνονται υπόψη στα μοντέλα, καθώς τα Ridge RAPMs βρέθηκαν να είναι πολύ υψηλά. Επιπλέον, χρησιμοποιήθηκε μέθοδος κανονικοποίησης Lasso αντί για Ridge για το μοντέλο Κανονικής κατανομής. Τα αποτελέσματα βελτιώθηκαν, καθώς το Lasso διακρίνει τους παίκτες υψηλότερης και χαμηλότερης ποιότητας με πιο ρεαλιστικό και λογικό τρόπο. Ωστόσο, η Κανονική κατανομή δεν είναι κατάλληλη για τη μοντελοποίηση μιας διακριτής μεταβλητής απόκρισης (πόντοι ανά κατοχή με τιμές από μηδέν έως τρεις).Ως επέκταση του προτεινόμενου από τη βιβλιογραφία μοντέλου παλινδρόμησης, μελετήθηκαν λογιστικά μοντέλα. Ξεκινώντας από την απλοποίηση του αρχικού προβλήματος, αναπτύχθηκαν κανονικοποιημένα (Ridge and Lasso) Διωνυμικά μοντέλα με μεταβλητή απόκρισης το αν ευστόχησαν ή όχι. Μια εναλλακτική ερμηνεία για τα Ridge-RAPMs δίνεται χρησιμοποιώντας αυτή τη μέθοδο.Το τελικό μοντέλο είναι μια Πολυωνυμική κατανομή των πόντων ανά κατοχή. Το μοντέλο προσαρμόστηκε έμμεσα μέσω τριών ξεχωριστών διωνυμικών μοντέλων για τους διαφορετικούς τύπους πόντων. Προτείνεται ένας δείκτης αξιολόγησης για τους αναμενόμενους πόντους ανά κατοχή (EPTS-RAPM). Θα δούμε ότι το πολυωνυμικό μοντέλο είναι πιο κατάλληλο για τη διακριτή μεταβλητή των πόντων και η αποδοτικότητά του είναι καλύτερη σύμφωνα με ορισμένα εξωτερικά κριτήρια. Επιπλέον, αυτή η μέθοδος φαίνεται να επιλύει εν μέρει το κοινό πρόβλημα των Plus/Minus δεικτών για τους παίκτες που δεν παίζουν πολύ. The aim of this work is to estimate the offensive and defensive contributions of NBA players to their teams. As Dean Oliver, one of the most important men of Basketball Statistics, said “Teamwork is the element of basketball most difficult to capture in any quantitative sense” (“Basketball on Paper”, 2004). Rosenbaum, D. T., (2004) being inspired by this quote- and later Ilardi, S., and Barzilai, A., (2008)- proposed a Ridge Regression model for estimating the players’ contribution by using only information on their teammates and opponents in the court. The index was called Regularized Adjusted Plus/Minus (RAPM).Firstly, we will see that low-time players should not be considered in the models since their Ridge RAPMs were found to be very high. Moreover, Lasso regularization method was used instead of Ridge for the Normal model. Results were improved since Lasso discriminates the higher and lower quality players in a more realistic and sensible way. However, the Normal distribution is not appropriate to model a discrete response variable (points per possession with values from zero to three). As an extension of the standard Ridge Regression model, logistic models were implemented. Starting from a simplification of the initial problem, regularized Binomial models were developed with a response variable of scoring or not. An alternative interpretation for the Ridge-RAPMs is given using this method. The final model is a Multinomial implementation of points scored per possession. The model was fitted indirectly via three separate binomial models for the different types of points scored (one, two, and three or more). A new evaluation metric is proposed for expected points per possession (EPTS-RAPM) is provided. We will see that the Multinomial model is more appropriate for the discrete variable of points and its performance is better according to some selected external validation criteria. In addition, this method seems to solve partially common problem with low time players in Plus/Minus ratings.
|
---|