Περίληψη : | Η παρούσα διπλωματική εργασία διεξάγεται στα πλαίσια της πρακτικής άσκησης που παρέχεται από την FSI. Η FSI είναι πάροχος λογισμικού για την βιομηχανία αθλητικών στοιχημάτων και τυχερών παιχνιδιών. Σε αυτή τη διατριβή, σκοπός είναι να προταθεί μια προσέγγιση στατιστικής μάθησης για την πρόβλεψη του αριθμού των γκολ που θα σημειωθούν από κάθε αθλητή σε μελλοντικούς αγώνες. Από την πλευρά της FSI, αυτές οι προβλέψεις μπορούν να χρησιμοποιηθούν είτε ως μελλοντικές προβλέψεις των αθλητών είτε ως αγορές αποδόσεων στοιχήματος αυτών.Σε αυτήν την προσέγγιση θα χρησιμοποιήσουμε ως μεταβλητές στα μοντέλα μας την διαθέσιμη πληροφορία πριν από κάθε αγώνα οι οποίες συνοψίζονται σε δύο επίπεδα: α) ομαδικά στατιστικά και β) ατομικά στατιστικά. Αυτά τα στατιστικά θα επιλεγούν με βάση την μέθοδο LASSO για τον προσδιορισμό των σημαντικότερων παραγόντων που επηρεάζουν την απόδοση σκοραρίσματος των αθλητών.Χρησιμοποιώντας την προτεινόμενη τεχνική μοντελοποίησης μας, υπολογίζουμε τις πιθανότητες σκοραρίσματος μιας συγκεκριμένης λίστας αθλητών για διάφορες αγωνιστικές της αγγλικής Premier League τη σεζόν 2022-2023 και τις συγκρίνουμε με αυτές που δίνουν οι στοιχηματικές εταιρίες προκειμένου να εξετάσουμε την ακρίβεια μοντέλου μας σε σχέση με αυτή των στοιχηματικών εταιριών. This thesis is conducted within the framework of the internship provided by FSI. FSI is a software provider for the Sports Betting and Gaming Industry. In this thesis, the purpose is to propose a statistical learning approach for the prediction of the number of goals scored by each soccer athlete in future matches. From the perspective of FSI, those predictions can be used either as future projections of the athletes or as corresponding betting odds markets of those ones.In this approach, we will use as covariates in our models the available pre-match information which is summarized in two levels: a) team-level statistics and b) soccer athlete-level statistics. Those statistics will be selected based on the Least Absolute Shrinkage and Selection Operator (LASSO) to identify the most important factors affecting the goal scoring performance of soccer athletes.Using our suggested modeling technique, we calculate the goal scoring probabilities of a list of athletes for various matchdays of the English Premier League in season 2022-2023 and we compare them with those given by the bookies to examine the accuracy of our model in relation to that of bookies.
|
---|