Λογότυπο αποθετηρίου
 

Modelling expected goals in football

dc.aueb.departmentDepartment of Management Science and Technology
dc.aueb.programBusiness Analytics
dc.contributor.opponentNtzoufras, Ioannisen
dc.contributor.opponentChatziantoniou, Damianosen
dc.contributor.thesisadvisorKarlis, Dimitriosen
dc.creatorΑργυρόπουλος, Δημοσθένηςel
dc.creatorArgyropoulos, Dimosthenisen
dc.date.accessioned2025-07-30T16:06:50Z
dc.date.available2025-07-30T16:06:50Z
dc.date.issued2025-07-16
dc.description.abstractΑυτή η μελέτη διερευνά πώς μπορούν να χρησιμοποιηθούν στατιστικά μοντέλα για την εκτίμηση της πιθανότητας να σημειωθεί ένα γκολ στο ποδόσφαιρο, χρησιμοποιώντας την έννοια των Αναμενόμενων Γκολ (xG). Βασισμένο σε δεδομένα από τη σεζόν 2015–2016 της Premier League (παρεχόμενα από τη StatsBomb), το έργο εξετάζει βασικούς παράγοντες όπως η απόσταση και η γωνία του σουτ, η θέση του παίκτη και η αμυντική πίεση. Μετά τον καθαρισμό των δεδομένων και την Εξερευνητική Ανάλυση Δεδομένων (EDA), αναπτύχθηκαν τέσσερα διαφορετικά μοντέλα λογιστικής παλινδρόμησης, συμπεριλαμβανομένου ενός πλήρους μοντέλου, δύο μοντέλων με χρήση των κριτηρίων AIC και BIC, καθώς και ενός μοντέλου με κανονικοποίηση LASSO, για την πρόβλεψη του αν ένα σουτ θα καταλήξει σε γκολ ή όχι. Κάθε μοντέλο αξιολογήθηκε με μετρικές όπως η ακρίβεια, η ακρίβεια θετικών προβλέψεων (precision), η ανάκληση, το F1-score και η ROC-AUC.Τα αποτελέσματα επιβεβαιώνουν ότι η στατιστική μοντελοποίηση μπορεί να εκτιμήσει με επιτυχία την πιθανότητα σκοραρίσματος βάσει μεταβλητών εντός αγώνα. Για την επαλήθευση της απόδοσης των αναπτυγμένων μοντέλων, οι προβλέψεις τους συγκρίθηκαν με τις επίσημες τιμές xG που παρείχε η StatsBomb, αναδεικνύοντας τόσο ομοιότητες όσο και διαφορές στις εκτιμήσεις, όπου παρατηρούμε ότι και τα τέσσερα μοντέλα παρουσιάζουν ισχυρή προβλεπτική ικανότητα σε σύγκριση με αυτήν τη στήλη. Αυτά τα ευρήματα είναι χρήσιμα για προπονητές ποδοσφαίρου, αναλυτές απόδοσης και επαγγελματίες του στοιχήματος που βασίζονται σε αποφάσεις καθοδηγούμενες από δεδομένα. Συνολικά, το έργο αναδεικνύει τον αυξανόμενο ρόλο της ανάλυσης δεδομένων στο ποδόσφαιρο και δείχνει πώς η μοντελοποίηση xG μπορεί να υποστηρίξει τόσο την ανάπτυξη στρατηγικής όσο και την αξιολόγηση απόδοσης.el
dc.description.abstractThis study explores how to use statistical models to estimate the chance of scoring a goal in football, using the concept of Expected Goals (xG). Based on detailed data from the 2015–2016 Premier League season (provided by StatsBomb), the project examines key factors like shot distance, angle, player position, and defensive pressure. After data cleaning and Exploratory Data Analysis (EDA), four different logistic regression models were developed including a full model, two models after using AIC and BIC criteria, and a LASSO-regularized model to predict if a shot would result in a goal or not. Each model was evaluated using metrics like accuracy, precision, recall, F1-score, and ROC-AUC. The results confirm that statistical modeling can successfully estimate scoring probability based on in-game variables. To validate the performance of the developed models, their predictions were compared to the official xG values provided by StatsBomb, highlighting both similarities and differences in estimation where we notice that the four models developed have strong predicting ability compared with this column. These findings are useful for football coaches, performance analysts, and betting professionals who rely on data-driven decisions. Overall, the project highlights the growing role of data analytics in football and shows how xG modeling can support both strategy development and performance evaluation.en
dc.embargo.ruleOpen access
dc.format.extentpages 68en
dc.identifier.urihttps://pyxida.aueb.gr/handle/123456789/12089
dc.identifier.urihttps://doi.org/10.26219/heal.aueb.9369
dc.languageen
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectExpected goalsen
dc.subjectLogistic reggressionen
dc.subjectSports dataen
dc.subjectΑναμενόμενα γκολel
dc.subjectΛογιστική παλινδρόμησηel
dc.subjectΑθλητικά δεδομέναel
dc.titleModelling expected goals in footballen
dc.title.alternativeΜοντελοποίηση αναμενόμενων γκολ (xG) στο ποδόσφαιροel
dc.typeText

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Argyropoulos_2025.pdf
Μέγεθος:
1.83 MB
Μορφότυπο:
Adobe Portable Document Format