Λογότυπο αποθετηρίου
 

Outcome prediction in Euroleague basketball: a machine learning approach

Μικρογραφία εικόνας

Ημερομηνία

2026-03-31

Τίτλος Εφημερίδας

Περιοδικό ISSN

Τίτλος τόμου

Εκδότης

Επιβλέπων / ουσα

Διαθέσιμο από

Περίληψη

This thesis examines whether modern machine learning techniques can accurately predict the outcome of EuroLeague basketball games using pre-game information. The study formulates the problem as a binary classification task where the objective is to estimate the probability of a home team win. A dataset of 4,637 games covering eighteen seasons is constructed, and team-level box score statistics are transformed into performance indicators and relative differences in order to capture competitive balance between opponents. Several models are implemented and compared within a unified experimental framework, including Logistic Regression, Random Forest, XGBoost, a Multi-Layer Perceptron, and an ensemble approach. All predictors are constructed using only information available before each game, and time-series cross-validation is applied to avoid data leakage and to simulate realistic forecasting conditions. Model performance is evaluated using multiple metrics, with particular emphasis on the Brier score in order to assess probabilistic accuracy. The results show that predictive performance is relatively stable across specifications, with logistic regression performing competitively against more complex models. Elastic Net regularization reduces the feature space without materially affecting performance, suggesting that a smaller and more parsimonious set of variables can retain most of the relevant information. A frequency-based feature importance analysis reveals a stable core of efficiency and team strength indicators that consistently drive predictions. Overall, the findings suggest that while advanced machine learning methods can provide marginal improvements, simpler and interpretable models remain strong benchmarks in the context of EuroLeague outcome prediction.
Η παρούσα διπλωματική εργασία εξετάζει κατά πόσο σύγχρονες τεχνικές μηχανικής μάθησης μπορούν να προβλέψουν με ακρίβεια το αποτέλεσμα αγώνων της EuroLeague χρησιμοποιώντας πληροφορίες διαθέσιμες πριν την έναρξη του αγώνα. Το πρόβλημα διατυπώνεται ως δυαδική ταξινόμηση, όπου ο στόχος είναι η εκτίμηση της πιθανότητας νίκης της γηπεδούχου ομάδας. Κατασκευάζεται ένα σύνολο δεδομένων 4.637 αγώνων που καλύπτει δεκαοκτώ αγωνιστικές περιόδους, ενώ τα ομαδικά στατιστικά φύλλου αγώνα μετασχηματίζονται σε δείκτες απόδοσης και σχετικές διαφορές ώστε να αποτυπωθεί η αγωνιστική ισορροπία μεταξύ των αντιπάλων. Υλοποιούνται και συγκρίνονται διάφορα μοντέλα σε ένα ενιαίο πειραματικό πλαίσιο, όπως Λογιστική Παλινδρόμηση, Random Forest, XGBoost, Πολυεπίπεδο Αντιληπτικό Δίκτυο και μια προσέγγιση συνδυασμού μοντέλων. Όλες οι μεταβλητές κατασκευάζονται αποκλειστικά με πληροφορίες διαθέσιμες πριν από κάθε αγώνα, ενώ εφαρμόζεται διασταυρωμένη επικύρωση χρονικής σειράς ώστε να αποφευχθεί η διαρροή πληροφορίας και να προσομοιωθούν ρεαλιστικές συνθήκες πρόβλεψης. Η απόδοση των μοντέλων αξιολογείται με πολλαπλά κριτήρια, με ιδιαίτερη έμφαση στο Brier score για την αποτίμηση της ποιότητας των πιθανοτικών προβλέψεων. Τα αποτελέσματα δείχνουν ότι η προβλεπτική απόδοση παραμένει σχετικά σταθερή μεταξύ των διαφορετικών προδιαγραφών, με τη Λογιστική Παλινδρόμηση να εμφανίζεται ιδιαίτερα ανταγωνιστική έναντι πιο σύνθετων μοντέλων. Η κανονικοποίηση Elastic Net μειώνει τον αριθμό των μεταβλητών χωρίς να επηρεάζει ουσιαστικά την απόδοση, υποδηλώνοντας ότι ένα πιο περιορισμένο και συνεκτικό σύνολο χαρακτηριστικών μπορεί να διατηρήσει το μεγαλύτερο μέρος της χρήσιμης πληροφορίας. Συνολικά, τα ευρήματα υποδεικνύουν ότι, παρότι πιο προχωρημένες τεχνικές μηχανικής μάθησης μπορούν να προσφέρουν οριακές βελτιώσεις, απλούστερα και πιο ερμηνεύσιμα μοντέλα παραμένουν ισχυρά σημεία αναφοράς στην πρόβλεψη αποτελεσμάτων της EuroLeague.

Περιγραφή

Λέξεις-κλειδιά

Sports analytics, Outcome prediction, Machine Learning (ML), Binary classification, Logistic regression, Random forest, XGBoost, Neural Networks (NN), Brier score, Πρόβλεψη αποτελέσματος, Λογιστική παλινδρόμηση, Μηχανική μάθηση, Δυαδική ταξινόμηση, Αθλητική αναλυτική, Προγνωστική μοντελοποίηση

Παραπομπή