EURO 2024 Semifinals Predictions
Προβλέψεις για το ΕΥΡΩΠΑΪΚΟ ΠΡΩΤΑΘΛΗΜΑ ΠΟΔΟΣΦΑΙΡΟΥ 2024 βασισμένες σε Στατιστικά Μοντέλα Αναλυτικής Ποδοσφαίρου
Ερευνητική ομάδα AUEB & Trieste Sports Analytics,
Οικονομικό Πανεπιστήμιο Αθηνών και Πανεπιστήμιο της Τεργέστης
Το παρόν άρθρο επιμελήθηκαν και συνέγραψαν είναι ο Ιωάννης Ντζούφρας, Καθηγητής Στατιστικής του ΟΠΑ, και η Αργυρώ Δαμουλάκη, Υποψήφια Διδάκτωρ στο ίδιο τμήμα. Το άρθρο είναι βασισμένο στην ανάλυση της συνεργαζόμενης ομάδας της Τεργέστης (καθηγητή Leonardo Egidi και τους υποψήφιους διδάκτορες Roberto Μacri Demartino και Giulio Fantuzzi) με τη συνδρομή των Β. Παλάσκα (OpenBet, ανάπτυξη εφαρμογής) Δ. Καρλή (Στατιστική ΟΠΑ, σύμβουλος ανάλυσης). Το τελικό αποτέλεσμα είναι συνεργασία των ερευνητικών ομάδων των δύο πανεπιστημίων σε θέματα Αναλυτικής του Αθλητισμού.
***
Φτάσαμε στα ημιτελικά του Ευρωπαϊκού Πρωταθλήματος 2024 με δύο σπουδαίες αναμετρήσεις μεταξύ παραδοσιακών «δυνάμεων». Η Ισπανία θα αντιμετωπίσει την Γαλλία ενώ η Ολλανδία την Αγγλία. Με βάση τους αγώνες έως τώρα, η Ισπανία φαίνεται να είναι σε καλύτερη φόρμα, ενώ οι Αγγλία και Γαλλία σκοράρουν με δυσκολία. Όσον αφορά την Ολλανδία, πέρασε τον όμιλο χωρίς να εντυπωσιάσει και είχε πιο «βατό» μονοπάτι στους δύο νοκ-άουτ γύρους. Όπως και στα προηγούμενα άρθρα, θα κάνουμε έναν σύντομο απολογισμό των προβλέψεων μας για τα προημιτελικά και θα παρουσιάζουμε τα «προγνωστικά» μας για τα ημιτελικά.
Υπενθύμιση για τους φίλους της Στατιστικής
Η χρήση στατιστικών τεχνικών για την πρόβλεψη αγώνων ποδοσφαίρου πρώτο-εμφανίστηκε στην επιστημονική βιβλιογραφία το 1968 με την πρωτοπόρα επιστημονική δημοσίευση των Reep & Benjamin. Οι επόμενες πραγματικές καινοτομίες εμφανίζονται στη δεκαετία του 80 (με την εργασία του Michael Maher) και τη δεκαετία του 90 (με την εργασία του Lee το 1997). Οι πρώτες όμως σημαντικές δημοσιεύσεις στο χώρο, εισάγοντας μοντέλα στα οποία βασίζονται και μοντέλα που χρησιμοποιούμε ακόμα και σήμερα, ήταν οι εργασίες των Dixon & Coles το 1997 και το διμεταβλητό μοντέλο Poisson των Καρλή και Ντζούφρα το 2003 (δύο από τους συγγραφείς της συγκεκριμένης ανάλυσης). Τα δύο αυτά μοντέλα έθεσαν τη βάση των συγχρόνων μοντέλων πρόβλεψης των αποτελεσμάτων αγώνων ποδοσφαίρου.
Σε αυτή την ανάλυση χρησιμοποιούμε το μοντέλο των Καρλή και Ντζούφρα μέσω του πακέτου “footbayes” στη στατιστική γλώσσα προγραμματισμού R που έχουν αναπτύξει ο Καθηγητής Leonardo Egidi από το Πανεπιστήμιο της Τεργέστης με τη συνδρομή του Βασίλη Παλάσκα (Αναλυτής στην Open Bet και ενεργό μέλος του AUEB Sports Analytics Group). Το μοντέλο επίσης συμπεριλαμβάνει την εκτίμηση παραμέτρων που εκτιμούν την απόδοση κάθε ομάδας που αλλάζουν στον χρόνο. Για την εκμάθηση του μοντέλου χρησιμοποιήθηκαν όλοι οι διεθνείς αγώνες της περιόδου 2020-2024. Κύρια επεξηγηματική μεταβλητή είναι η διαφορά μεταξύ των δύο ομάδων στο δείκτη Coca-Cola/FIFA ranking. Το μοντέλο, που προτάθηκε για πρώτη φορά από τους Καρλή & Ντζούφρα το 2003, επεκτείνει το συνηθισμένο διμεταβλητό μοντέλο Poisson. Λεπτομέρειες για το μοντέλο στατιστικής και μηχανικής μάθησης που χρησιμοποιήθηκε θα βρείτε στο τέλος αυτού του άρθρου.
Απολογισμός των προημιτελικών.
Τόσο η Γαλλία όσο και η Αγγλία χρειάστηκαν την διαδικασία των πέναλτι για να επικρατήσουν εν τέλει απέναντι στην Πορτογαλία και Ελβετία, αντίστοιχα. Το μοντέλο είχε μεν «προβλέψει» νίκη των δύο ομάδων με όχι μεγάλη πιθανότητα, όμως είχε αποδώσει αξιοσημείωτη πιθανότητα στην ισοπαλία, 28%, όπως και έληξε η κανονική διάρκεια των δύο αγώνων. Η Ολλανδία επικράτησε απέναντι στην Τουρκία με ανατροπή (ενώ το νικηφόρο γκολ ήταν αυτογκόλ) στην κανονική διάρκεια, όπως είχε προβλέψει το μοντέλο (νίκη Ολλανδίας με πιθανότητα 61%). Όσον αφορά τον συναρπαστικό αγώνα μεταξύ Ισπανίας και Γερμανίας, η πρώτη επικράτησε στην παράταση με γκολ στο τελευταίο λεπτό. Να σημειωθεί ότι η ισοπαλία ήταν αρκετά πιθανό αποτέλεσμα με βάση το μοντέλο, 28%, ενώ η νίκη της Ισπανίας είχε πιθανότητα 45%.
Συνολικά, το μοντέλο προέβλεψε σωστά τον έναν αγώνα (1/4) ενώ τα ισόπαλα αποτελέσματα στους υπόλοιπους τρεις αγώνες ήταν αξιοσημείωτη (28%).
Πιθανότητες |
Επικρατέστερο |
|||||
Αντίπαλες ομάδες (Α-Β) |
Νίκη Α ομάδας |
Ισοπαλία |
Νίκη Β ομάδας |
Αποτέλεσμα (Πιθανότητα) |
Τελικό Αποτέλεσμα |
|
Ισπανία |
Γερμανία |
0.453 |
0.276 |
0.271 |
1-0 (0.127) |
2 – 1 |
Πορτογαλία |
Γαλλία |
0.270 |
0.283 |
0.447 |
0-1 (0.131) |
0(3) – 0(5) |
Αγγλία |
Ελβετία |
0.530 |
0.277 |
0.193 |
1-0 (0.165) |
2(5) – 1(3) |
Ολλανδία |
Τουρκία |
0.606 |
0.210 |
0.184 |
2-0 (0.095) |
2 – 1 |
Πίνακας 1: Πίνακας με τις πιθανότητες έκβασης των αγώνων για τα προημιτελικά του Ευρωπαϊκού Πρωταθλήματος 2024.
Προβλέψεις για τα Ημιτελικά
Στη φάση αυτή, όλα τα αγωνιστικά αποτελέσματα είναι δυνατά, κάτι που αντανακλάται στα προγνωστικά του μοντέλου μας. Συγκεκριμένα, ο πρώτος ημιτελικός μεταξύ Ισπανίας και Γαλλίας φαίνεται να είναι εξαιρετικά αμφίρροπος, αφού η πιθανότητα νίκης της πρώτης είναι 33%,, της δεύτερης 36% και της ισοπαλίας 31%. Όσον αφορά την δεύτερη αναμέτρηση, η πιθανότητα νίκης της Αγγλίας αγγίζει το 50% (49,5% για την ακρίβεια) και έτσι έχει ένα ελαφρύ προβάδισμα με βάση το μοντέλο, χωρίς φυσικά να είναι φαβορί από τη στιγμή που τόσο η νίκη της Ολλανδίας όσο και η ισοπαλία είναι έχουν αυξημένη πιθανότητα (24% και 26% αντίστοιχα).
Πίνακας 2: Πίνακας με τις πιθανότητες έκβασης των αγώνων για τα ημιτελικά του Ευρωπαϊκού Πρωταθλήματος 2024.
Πιθανότητες |
Επικρατέστερο |
||||
Αντίπαλες ομάδες (Α-Β) |
Νίκη Α ομάδας |
Ισοπαλία |
Νίκη Β ομάδας |
Αποτέλεσμα (Πιθανότητα) |
|
Ισπανία |
Γαλλία |
0.333 |
0.308 |
0.359 |
0-0 (0.154) |
Ολλανδία |
Αγγλία |
0.244 |
0.262 |
0.495 |
0-1 (0.127) |
Το Διάγραμμα 1 δίνει με πιο πολύ λεπτομέρεια τις πιθανότητες για το κάθε σκορ για καθένα από τους 2 των ημιτελικών.
Διάγραμμα 1: Διάγραμμα Πιθανοτήτων πιθανών σκορ για τα ημιτελικά του Ευρωπαϊκού Πρωταθλήματος 2024.