EURO 2024 Round 8 Predictions

Προβλέψεις για το ΕΥΡΩΠΑΪΚΟ ΠΡΩΤΑΘΛΗΜΑ ΠΟΔΟΣΦΑΙΡΟΥ 2024 βασισμένες σε Στατιστικά Μοντέλα Αναλυτικής Ποδοσφαίρου

Ερευνητική ομάδα AUEB & Trieste Sports Analytics,

Οικονομικό Πανεπιστήμιο Αθηνών και Πανεπιστήμιο της Τεργέστης

Το παρόν άρθρο επιμελήθηκαν και συνέγραψαν ο Ιωάννης Ντζούφρας, Καθηγητής Στατιστικής του ΟΠΑ, και η Αργυρώ Δαμουλάκη, Υποψήφια Διδάκτωρ στο ίδιο τμήμα. Το άρθρο είναι βασισμένο στην ανάλυση της συνεργαζόμενης ομάδας της Τεργέστης (καθηγητή Leonardo Egidi και τους υποψήφιους διδάκτορες Roberto Μacri Demartino και Giulio Fantuzzi) με τη συνδρομή των Β. Παλάσκα (OpenBet, ανάπτυξη εφαρμογής) Δ. Καρλή (Στατιστική ΟΠΑ, σύμβουλος ανάλυσης). Το τελικό αποτέλεσμα είναι συνεργασία των ερευνητικών ομάδων των δύο πανεπιστημίων σε θέματα Αναλυτικής του Αθλητισμού.

***

Τα προημιτελικά του Ευρωπαϊκού Πρωταθλήματος 2024 είναι εδώ και μας περιμένουν μεγάλες αναμετρήσεις. Δύο κλασσικά «ντέρμπι», μεταξύ Ισπανίας-Γερμανίας και Πορτογαλίας-Γαλλίας, και δύο ομάδες που είναι έτοιμες να διεκδικήσουν την πρόκριση, Ελβετία και Τουρκία,  απέναντι στις παραδοσιακές δυνάμεις της Αγγλίας και Ολλανδίας. Έπειτα από έναν σύντομο απολογισμό των προβλέψεων μας για την φάση των 16, παρουσιάζουμε τα «προγνωστικά» μας για τα προημιτελικά.

Υπενθύμιση για τους φίλους της Στατιστικής   

Η χρήση στατιστικών τεχνικών για την πρόβλεψη αγώνων ποδοσφαίρου πρώτο-εμφανίστηκε στην επιστημονική βιβλιογραφία το 1968 με την πρωτοπόρα επιστημονική δημοσίευση των Reep & Benjamin. Οι επόμενες πραγματικές καινοτομίες εμφανίζονται στη δεκαετία του 80 (με την εργασία του Michael Maher) και τη δεκαετία του 90 (με την εργασία του Lee το 1997). Οι πρώτες όμως σημαντικές δημοσιεύσεις στο χώρο, εισάγοντας μοντέλα στα οποία βασίζονται και μοντέλα που χρησιμοποιούμε ακόμα και σήμερα, ήταν οι εργασίες των Dixon & Coles το 1997 και το διμεταβλητό μοντέλο Poisson των Καρλή και Ντζούφρα το 2003 (δύο από τους συγγραφείς της συγκεκριμένης ανάλυσης). Τα δύο αυτά μοντέλα έθεσαν τη βάση των συγχρόνων μοντέλων πρόβλεψης των αποτελεσμάτων αγώνων ποδοσφαίρου.

Σε αυτή την ανάλυση χρησιμοποιούμε το μοντέλο των Καρλή και Ντζούφρα μέσω του πακέτου “footbayes” στη στατιστική γλώσσα προγραμματισμού R που έχουν αναπτύξει ο Καθηγητής Leonardo Egidi από το Πανεπιστήμιο της Τεργέστης με τη συνδρομή του Βασίλη Παλάσκα (Αναλυτής στην Open Bet και ενεργό μέλος του AUEB Sports Analytics Group). Το μοντέλο επίσης συμπεριλαμβάνει την εκτίμηση παραμέτρων που εκτιμούν την απόδοση κάθε ομάδας που αλλάζουν στον χρόνο. Για την εκμάθηση του μοντέλου χρησιμοποιήθηκαν όλοι οι διεθνείς αγώνες της περιόδου 2020-2024. Κύρια επεξηγηματική μεταβλητή είναι η διαφορά μεταξύ των δύο ομάδων στο δείκτη Coca-Cola/FIFA ranking.  Το μοντέλο, που προτάθηκε για πρώτη φορά από τους Καρλή & Ντζούφρα το 2003, επεκτείνει το συνηθισμένο διμεταβλητό μοντέλο Poisson.  Λεπτομέρειες για το μοντέλο στατιστικής και μηχανικής μάθησης που χρησιμοποιήθηκε θα βρείτε στο τέλος αυτού του άρθρου.

Απολογισμός της φάσης των 16.

Με την ολοκλήρωση της φάσης των 16 ο απολογισμός είναι αρκετά ικανοποιητικός, αφού το μοντέλο κατάφερε να προβλέψει σωστά το 75% των αγώνων. Τα παιχνίδια ήταν κατά βάση αμφίρροπα, όπως όλοι οι νοκ-άουτ αγώνες, ενώ τα φαβορί δεν επικράτησαν τόσο εύκολα. Η Γαλλία κέρδισε το Βέλγιο με αυτογκόλ στο 85’, η Αγγλία ισοφάρισε στις καθυστερήσεις και κέρδισε την Σλοβακία στην παράταση ενώ η Πορτογαλία χρειάστηκε τη διαδικασία των πέναλτι για να κάμψει την αντίσταση της Σλοβενίας. Οι Ισπανία, Γερμανία και Ολλανδία επικράτησαν εύκολα απέναντι στις αντιπάλους τους. Η μεγάλη έκπληξη της φάσης των 16 ήταν η Ελβετία, η οποία επικράτησε άνετα απέναντι στην Ιταλία. Αντίστοιχη ήταν και η έκπληξη-νίκη της Τουρκίας απέναντι στην Αυστρία που όμως φάνηκε δυσκολοκατάβλητη μέχρι τέλους. Να σημειωθεί ότι η πιθανότητα νίκης της Ελβετίας με βάση το μοντέλο ήταν αξιοσημείωτη (29%), όπως και της Τουρκίας που δεν ήταν αμελητέα (22%).

Πιθανότητες

Επικρατέστερο

Αντίπαλες ομάδες (Α-Β)

Νίκη Α

ομάδας

Ισοπαλία

Νίκη Β

ομάδας

Αποτέλεσμα

(Πιθανότητα)

Τελικό Αποτέλεσμα

Ελβετία

Ιταλία

0.288

0.273

0.439

0-1 (0.123)

2 – 0

Γερμανία

Δανία

0.448

0.263

0.289

1-0 (0.120)

2 – 0

Αγγλία

Σλοβακία

0.714

0.206

0.080

1-0 (0.160)

2 – 1

Ισπανία

Γεωργία

0.726

0.186

0.088

2-0 (0.139)

4 – 1

Γαλλία

Βέλγιο

0.406

0.301

0.293

0-0 (0.152)

1 – 0

Πορτογαλία

Σλοβενία

0.653

0.220

0.127

1-0 (0.145)

0 – 0

Ρουμανία

Ολλανδία

0.163

0.213

0.624

0-1 (0.109)

0 – 3

Αυστρία

Τουρκία

0.550

0.231

0.218

1-0 (0.101)

1 – 2

Πίνακας 1: Πίνακας με τις πιθανότητες έκβασης των αγώνων για την φάση των 16 του Ευρωπαϊκού Πρωταθλήματος 2024.

Προβλέψεις για την Φάση των 8

Οδεύοντας προς τα τελικά, οι διαφορές μεταξύ των ομάδων είναι μικρότερες και οι αγώνες πιο αμφίρροποι. Από τον Πίνακα 2 με τα πιθανά αποτελέσματα ξεχωρίζουν ως φαβορί οι ακόλουθες ομάδες:

  1. Η Ολλανδία με πιθανότητα νίκης 61% έναντι της Τουρκίας
  2. Η Αγγλία με πιθανότητα νίκης 53% έναντι της Ελβετίας

Από τα δύο αυτά φαβορί, η Ολλανδία είχε δείξει μέτριο πρόσωπο στη φάση των ομίλων αλλά φαίνεται ότι «ανέβασε στροφές» στα νοκ-άουτ. Η Αγγλία, από την άλλη πλευρά, προβλημάτισε στη φάση των 16 τη στιγμή που η Ελβετία δείχνει πολύ δυνατή ως αντίπαλος και φαίνεται με βάση τους αγώνες ότι θα δυσκολέψει αρκετά περισσότερο την Αγγλία από ότι προβλέπει το μοντέλο. Μάλιστα και η πιθανότητα ισοπαλίας είναι αυξημένη (28%).

Τέλος, οι υπόλοιποι δύο αγώνες είναι πιο αμφίρροποι αλλά με ελαφρύ προβάδισμα της μίας από τις δύο ομάδες. Σε αυτούς τους αγώνες θεωρούμε ότι οι ομάδες είναι σχετικά κοντά. Συγκεκριμένα, έχουμε:

  1. Ισπανία (45%) να επικρατεί της Γερμανίας (27%)
  2. Γαλλία (45%) να επικρατεί της Πορτογαλίας (27%)

Για τους δύο αυτούς αγώνες, η πιθανότητα ισοπαλίας είναι αυξημένη (28%) και οποιοδήποτε αποτέλεσμα δεν είναι απίθανο.  

Πίνακας 2: Πίνακας με τις πιθανότητες έκβασης των αγώνων για την φάση των 8 του Ευρωπαϊκού Πρωταθλήματος 2024.

Πιθανότητες

Επικρατέστερο

Αντίπαλες ομάδες (Α-Β)

Νίκη Α

ομάδας

Ισοπαλία

Νίκη Β

ομάδας

Αποτέλεσμα

(Πιθανότητα)

Ισπανία

Γερμανία

0.453

0.276

0.271

1-0 (0.127)

Πορτογαλία

Γαλλία

0.270

0.283

0.447

0-1 (0.131)

Αγγλία

Ελβετία

0.530

0.277

0.193

1-0 (0.165)

Ολλανδία

Τουρκία

0.606

0.210

0.184

2-0 (0.095)

Το Διάγραμμα 1 δίνει με πιο πολύ λεπτομέρεια τις πιθανότητες για το κάθε σκορ για καθένα από τους 8 αγώνες της φάσης των 16.

Διάγραμμα  1: Διάγραμμα Πιθανοτήτων πιθανών σκορ για την φάση των 16 του Ευρωπαϊκού Πρωταθλήματος 2024.

Βιβλιογραφία για διαβαστερούς φιλάθλους

  • Dixon, M.J. and Coles, S.G. (1997), Modelling Association Football Scores and Inefficiencies in the Football Betting Market. Journal of the Royal Statistical Society: Series C (Applied Statistics), 46, 265-280.
  • Karlis, D. and Ntzoufras, I. (2003), Analysis of sports data by using bivariate Poisson models. Journal of the Royal Statistical Society: Series D (The Statistician), 52, 381-393. 
  • Lee A.J. (1997). Modeling Scores in the Premier League: Is Manchester United Really the Best?  Chance, 10, 15-19.
  • Maher, M.J. (1982), Modelling association football scores. Statistica Neerlandica, 36, 109-118.
  • Reep, C., & Benjamin, B. (1968). Skill and Chance in Association Football. Journal of the Royal Statistical Society. Series A (General), 131, 581-585.

Οι Μαγικές Εξισώσεις του στατιστικού μοντέλου