EURO 2024 Round 16 Predictions

Προβλέψεις για το ΕΥΡΩΠΑΪΚΟ ΠΡΩΤΑΘΛΗΜΑ ΠΟΔΟΣΦΑΙΡΟΥ 2024 βασισμένες σε Στατιστικά Μοντέλα Αναλυτικής Ποδοσφαίρου

Ερευνητική ομάδα AUEB & Trieste Sports Analytics,

Οικονομικό Πανεπιστήμιο Αθηνών και Πανεπιστήμιο της Τεργέστης

Το παρόν άρθρο επιμελήθηκαν και συνέγραψαν ο Ιωάννης Ντζούφρας, Καθηγητής Στατιστικής του ΟΠΑ, και η Αργυρώ Δαμουλάκη, Υποψήφια Διδάκτωρ στο ίδιο τμήμα. Το άρθρο είναι βασισμένο στην ανάλυση της συνεργαζόμενης ομάδας της Τεργέστης (καθηγητή Leonardo Egidi και τους υποψήφιους διδάκτορες Roberto Μacri Demartino και Giulio Fantuzzi) με τη συνδρομή των Β. Παλάσκα (OpenBet, ανάπτυξη εφαρμογής) Δ. Καρλή (Στατιστική ΟΠΑ, σύμβουλος ανάλυσης). Το τελικό αποτέλεσμα είναι συνεργασία των ερευνητικών ομάδων των δύο πανεπιστημίων σε θέματα Αναλυτικής του Αθλητισμού.

***

Η φάση των ομίλων ολοκληρώθηκε με αρκετές εκπλήξεις και μπαίνουμε στη φάση των νοκ-αουτ αγώνων. Ως κλασσικό «φαβορί» θα χαρακτηρίζαμε την Γερμανία απέναντι στη Γεωργία, η οποία όμως έδειξε χαρακτήρα και δε θα είναι εύκολη αντίπαλος. Επίσης, μεγάλο ενδιαφέρον έχει το πώς θα παρουσιαστούν η Αγγλία, Ολλανδία, Πορτογαλία και Γαλλία, οι οποίες δεν άφησαν καλές εντυπώσεις τον πρώτο γύρο. Ξεκινάμε, λοιπόν, με ένα σύντομο απολογισμό των προβλέψεων μας για την φάση των ομίλων και στη συνέχεια παρουσιάζουμε τα «προγνωστικά» μας για την φάση των 16 όπου πιστεύουμε ότι τα φαβορί θα αρχίσουν να δείχνουν τις δυνατότητες τους και κατά πόσο μπορούν να φτάσουν στην κατάκτηση του τροπαίου. 

Υπενθύμιση για τους φίλους της Στατιστικής   

Η χρήση στατιστικών τεχνικών για την πρόβλεψη αγώνων ποδοσφαίρου πρώτο-εμφανίστηκε στην επιστημονική βιβλιογραφία το 1968 με την πρωτοπόρα επιστημονική δημοσίευση των Reep & Benjamin. Οι επόμενες πραγματικές καινοτομίες εμφανίζονται στη δεκαετία του 80 (με την εργασία του Michael Maher) και τη δεκαετία του 90 (με την εργασία του Lee το 1997). Οι πρώτες όμως σημαντικές δημοσιεύσεις στο χώρο, εισάγοντας μοντέλα στα οποία βασίζονται και μοντέλα που χρησιμοποιούμε ακόμα και σήμερα, ήταν οι εργασίες των Dixon & Coles το 1997 και το διμεταβλητό μοντέλο Poisson των Καρλή και Ντζούφρα το 2003 (δύο από τους συγγραφείς της συγκεκριμένης ανάλυσης). Τα δύο αυτά μοντέλα έθεσαν τη βάση των συγχρόνων μοντέλων πρόβλεψης των αποτελεσμάτων αγώνων ποδοσφαίρου.

Σε αυτή την ανάλυση χρησιμοποιούμε το μοντέλο των Καρλή και Ντζούφρα μέσω του πακέτου “footbayes” στη στατιστική γλώσσα προγραμματισμού R που έχουν αναπτύξει ο Καθηγητής Leonardo Egidi από το Πανεπιστήμιο της Τεργέστης με τη συνδρομή του Βασίλη Παλάσκα (Αναλυτής στην Open Bet και ενεργό μέλος του AUEB Sports Analytics Group). Το μοντέλο επίσης συμπεριλαμβάνει την εκτίμηση παραμέτρων που εκτιμούν την απόδοση κάθε ομάδας που αλλάζουν στον χρόνο. Για την εκμάθηση του μοντέλου χρησιμοποιήθηκαν όλοι οι διεθνείς αγώνες της περιόδου 2020-2024. Κύρια επεξηγηματική μεταβλητή είναι η διαφορά μεταξύ των δύο ομάδων στο δείκτη Coca-Cola/FIFA ranking.  Το μοντέλο, που προτάθηκε για πρώτη φορά από τους Καρλή & Ντζούφρα το 2003, επεκτείνει το συνηθισμένο διμεταβλητό μοντέλο Poisson.  Λεπτομέρειες για το μοντέλο στατιστικής και μηχανικής μάθησης που χρησιμοποιήθηκε θα βρείτε στο τέλος αυτού του άρθρου.

Απολογισμός 3ης αγωνιστικής και της φάσης των γκρουπ.

Ο απολογισμός της 3ης αγωνιστικής βρίσκει το μοντέλο μας να κινείται σε ρηχά νερά καθώς τα φαβορί (Γερμανία, Αγγλία, Γαλλία, Ολλανδία, Βέλγιο και Πορτογαλία) δεν κατάφεραν να κερδίσουν. Η μεγαλύτερη έκπληξη ήταν η νίκη της Γεωργίας επί της Πορτογαλίας η οποία είχε πιθανότητα εμφάνισης μόλις 6% με βάση το μοντέλο. Να σημειώσουμε ότι η 3η αγωνιστική παραδοσιακά είναι η πιο δύσκολη όσον αφορά τις προβλέψεις καθώς πολλές ομάδες παίζουν ποδόσφαιρο σκοπιμότητας έτσι ώστε να πάρουν την ισοπαλία για την πρόκριση ή ακόμα και κάποιες ομάδες που έχουν εξασφαλίσει την πρόκριση δεν χρησιμοποιούν βασικούς τους παίκτες.  

Συνολικά το μοντέλο σε όλους τους αγώνες της φάσης των γκρουπ πήγε σχετικά ικανοποιητικά καθώς έπιασε ή απεικόνισε την ροή του αγώνα σε ποσοστό 56%.

Πιθανότητες

Επικρατέστερο

Αντίπαλες ομάδες (Α-Β)

Νίκη Α

ομάδας

Ισοπαλία

Νίκη Β

ομάδας

Αποτέλεσμα

(Πιθανότητα)

Τελικό Αποτέλεσμα

Ελβετία

Γερμανία

0.283

0.261

0.455

0-1 (0.116)

1 – 1

Σκωτία

Ουγγαρία

0.262

0.288

0.450

0-1 (0.140)

0 – 1

Αλβανία

Ισπανία

0.058

0.170

0.772

0-2 (0.171)

0 – 1

Κροατία

Ιταλία

0.308

0.278

0.414

0-1 (0.120)

1 – 1

Γαλλία

Πολωνία

0.714

0.189

0.097

2-0 (0.138)

1 – 1

Ολλανδία

Αυστρία

0.482

0.250

0.267

1-0 (0.108)

2 – 3

Δανία

Σερβία

0.442

0.289

0.269

1-0 (0.143)

0 – 0

Αγγλία

Σλοβενία

0.735

0.190

0.076

1-0 (0.167)

0 – 0

Σλοβακία

Ρουμανία

0.319

0.312

0.369

0-0 (0.161)

1 – 1

Ουκρανία

Βέλγιο

0.135

0.218

0.647

0-1 (0.128)

0 – 0

Γεωργία

Πορτογαλία

0.060

0.130

0.810

0-3 (0.105)

2 – 0

Τσεχία

Τουρκία

0.401

0.263

0.336

1-1 (0.109)

1 – 2

Πίνακας 1: Πίνακας με τις πιθανότητες έκβασης των αγώνων για την 3η αγωνιστική του Ευρωπαϊκού Πρωταθλήματος 2024.

Προβλέψεις για την Φάση των 16

Από τον Πίνακα 2 με τα πιθανά αποτελέσματα ξεχωρίζουν ως φαβορί οι ακόλουθες ομάδες:

  1. Η Ισπανία με πιθανότητα νίκης 73% έναντι της Γεωργίας
  2. Η Αγγλία με πιθανότητα νίκης 71% έναντι της Σλοβακίας
  3. Η Πορτογαλία με πιθανότητα νίκης 65% έναντι της Σλοβενίας
  4. Η Ολλανδία με πιθανότητα νίκης 62% έναντι της Ρουμανίας

Από τα τέσσερα αυτά φαβορί, η Ισπανία, με βάση τις εμφανίσεις στο EURO, φαίνεται όντως να είναι το αδιαμφισβήτητο φαβορί. Το μοντέλο φαίνεται να υπερεκτιμάει την Αγγλία που μέχρι στιγμής έχει κάνει τη δουλειά αλλά όχι με ιδιαίτερα εντυπωσιακό τρόπο. Επίσης η Πορτογαλία φαίνεται να είναι ικανή να νικήσει τη Σλοβενία σχετικά εύκολα με βάση την εικόνα της πριν τον αγώνα με την Γεωργία. Ο τελευταίος αγώνας μας έβαλε σε κάποιες αμφιβολίες. Τέλος, η Ολλανδία έχει απογοητεύσει μέχρι τώρα και μάλλον η πιθανότητα 62% υπερεκτιμάει την τρέχουσα κατάσταση του αγώνα (να θυμίσουμε ότι το μοντέλο χρησιμοποιεί και αγώνες από τους προηγούμενους αγώνες).

Τέλος, οι υπόλοιποι τέσσερις αγώνες (οι μισοί!) είναι πιο αμφίρροποι αλλά με ελαφρύ προβάδισμα της μίας από τις δύο ομάδες. Σε αυτούς τους αγώνες θεωρούμε ότι οι ομάδες είναι σχετικά κοντά και μπορεί να έρθουν και ισοπαλία λόγω τακτικής και στρατηγικής. Συγκεκριμένα, έχουμε

  1. Αυστρία (55%) να επικρατεί της Τουρκίας (22%) αλλά με αυξημένη πιθανότητα ισοπαλίας (23%)
  2. Ιταλία (44%) να επικρατεί της Ελβετίας (29%)
  3. Γερμανία (45%) να επικρατεί της Δανίας (29%)
  4. Γαλλία (41%) να επικρατεί του Βελγίου (29%) αλλά με αυξημένη πιθανότητα ισοπαλίας (30%)

Από αυτούς τους αγώνες, η Ελβετία έχει δείξει πολύ δυνατή ως αντίπαλος και φαίνεται με βάση τους αγώνες ότι θα δυσκολέψει αρκετά περισσότερο την Ιταλία από ότι προβλέπει το μοντέλο.

Πίνακας 2: Πίνακας με τις πιθανότητες έκβασης των αγώνων για την φάση των 16 του Ευρωπαϊκού Πρωταθλήματος 2024.

Πιθανότητες

Επικρατέστερο

Αντίπαλες ομάδες (Α-Β)

Νίκη Α

ομάδας

Ισοπαλία

Νίκη Β

ομάδας

Αποτέλεσμα

(Πιθανότητα)

Ελβετία

Ιταλία

0.288

0.273

0.439

0-1 (0.123)

Γερμανία

Δανία

0.448

0.263

0.289

1-0 (0.120)

Αγγλία

Σλοβακία

0.714

0.206

0.080

1-0 (0.160)

Ισπανία

Γεωργία

0.726

0.186

0.088

2-0 (0.139)

Γαλλία

Βέλγιο

0.406

0.301

0.293

0-0 (0.152)

Πορτογαλία

Σλοβενία

0.653

0.220

0.127

1-0 (0.145)

Ρουμανία

Ολλανδία

0.163

0.213

0.624

0-1 (0.109)

Αυστρία

Τουρκία

0.550

0.231

0.218

1-0 (0.101)

Το Διάγραμμα 1 δίνει με πιο πολύ λεπτομέρεια τις πιθανότητες για το κάθε σκορ για καθένα από τους 8 αγώνες της φάσης των 16.

Διάγραμμα  1: Διάγραμμα Πιθανοτήτων πιθανών σκορ για την φάση των 16 του Ευρωπαϊκού Πρωταθλήματος 2024.

Βιβλιογραφία για διαβαστερούς φιλάθλους

  • Dixon, M.J. and Coles, S.G. (1997), Modelling Association Football Scores and Inefficiencies in the Football Betting Market. Journal of the Royal Statistical Society: Series C (Applied Statistics), 46, 265-280.
  • Karlis, D. and Ntzoufras, I. (2003), Analysis of sports data by using bivariate Poisson models. Journal of the Royal Statistical Society: Series D (The Statistician), 52, 381-393. 
  • Lee A.J. (1997). Modeling Scores in the Premier League: Is Manchester United Really the Best?  Chance, 10, 15-19.
  • Maher, M.J. (1982), Modelling association football scores. Statistica Neerlandica, 36, 109-118.
  • Reep, C., & Benjamin, B. (1968). Skill and Chance in Association Football. Journal of the Royal Statistical Society. Series A (General), 131, 581-585.