Προβλέψεις 3ης αγωνιστικής Mundial 2022
Προβλέψεις για το ΠΑΓΚΟΣΜΙΟ ΚΥΠΕΛΛΟ ΠΟΔΟΣΦΑΙΡΟΥ 2022 βασισμένες σε Στατιστικά Μοντέλα Αναλυτικής Ποδοσφαίρου
L. Egidi, Β. Παλάσκας, Ι. Ντζούφρας & Δ. Καρλής
Ερευνητική ομάδα AUEB Sports Analytics,
Οικονομικό Πανεπιστήμιο Αθηνών, Πανεπιστήμιο της Τεργέστης & Fantasy Sports Interactive
Συγγραφέας του παρόντος άρθρου είναι ο Ιωάννης Ντζούφρας. Το άρθρο είναι βασισμένο στην ανάλυση των Leonardo Egidi (Πανεπιστήμιο της Τεργέστης) και του Βασίλειου Παλάσκα (Fantasy Sports Interactive) με τις συμβουλευτικές συνδρομές των Ι. Ντζούφρα και Δ. Καρλή. Και οι τέσσερεις συγγραφείς είναι ενεργά μέλη της ερευνητικής ομάδας του Οικονομικού Πανεπιστημίου Αθηνών: AUEB Sports Analytics Group.
***
Φτάσαμε στο τέλος της 2ης αγωνιστικής της φάσης των ομίλων του μουντιάλ. Ας σου δούμε που βρισκόμαστε μέχρι στιγμής με βάση τα αποτελέσματα και το μοντέλο της ερευνητικής μας ομάδας.
Να υπενθυμίσουμε ότι σε αυτή την ανάλυση χρησιμοποιούμε το μοντέλο των Καρλή και Ντζούφρα μέσω του πακέτου “footbayes” στη στατιστική γλώσσα προγραμματισμού R που έχουν αναπτύξει οι 2 πρώτοι συγγραφείς αυτού του άρθρου και της ανάλυσης. Το μοντέλο επίσης συμπεριλαμβάνει την εκτίμηση παραμέτρων που εκτιμούν την απόδοση κάθε ομάδας που αλλάζουν στον χρόνο. Για την εκμάθηση του μοντέλου χρησιμοποιήθηκαν περισσότερα από 3000 διεθνείς αγώνες της περιόδου 2018-2022. Κύρια επεξηγηματική μεταβλητή είναι η διαφορά μεταξύ των δύο ομάδων στο δείκτη Coca-Cola/FIFA ranking. Το μοντέλο, που προτάθηκε για πρώτη φορά από τους Καρλή & Ντζούφρα το 2003, επεκτείνει το συνηθισμένο διμεταβλητό μοντέλο Poisson. Λεπτομέρειες για το μοντέλο στατιστικής και μηχανικής μάθησης που χρησιμοποιήθηκε θα βρείτε στο τέλος αυτού του άρθρου.
Οι Προβλέψεις του Μοντέλου για την 3η Αγωνιστική
Η 2η αγωνιστική είχε πολλές εκπλήξεις και μη αναμενόμενα αποτελέσματα. Οι ενημερωμένες προβλέψεις με τη μορφή πιθανοτήτων δίνονται στον Πίνακα 1. Ως φαβορί δηλώνεται η ομάδα με τη μεγαλύτερη πιθανότητα νίκης.
Συγκεκριμένα από τον Πίνακα 1 έχουμε 3 αγώνες που οι δύο ομάδες είναι κοντά και στην ουσία δεν είναι εύκολο να αποφασίσουμε τον νικητή. Συγκεκριμένα αυτοι οι αγώνες είναι
- Εκουαδόρ-Σενεγάλη
- Ελβετία-Σερβία
- ΗΠΑ-Ιράν
Σύμφωνα με τα αποτελέσματα έχουμε 10 αγώνες που έχουμε το νικητή με πιθανότητα μεγαλύτερη του 50%. Συγκεκριμένα,
- Η Βραζιλία με πιθανότητα νίκης 80% έναντι του Καμερούν
- Η Ολλανδία με πιθανότητα νίκης 77% έναντι του Κατάρ
- Η Ουρουγουάη με πιθανότητα νίκης 68% έναντι της Γκάνα
- Η Αργεντινή με πιθανότητα νίκης 66% έναντι της Πολωνίας
- Η Γερμανία με πιθανότητα νίκης 65% έναντι της Κόστα Ρίκα
- Η Γαλλία με πιθανότητα νίκης 64% έναντι της Τυνησίας
- Η Αγγλία με πιθανότητα νίκης 62% έναντι της Ουαλίας
- Η Πορτογαλία με πιθανότητα νίκης 61% έναντι της Νότιας Κορέας
- Η Ισπανία με πιθανότητα νίκης 57.5% έναντι της Ιαπωνίας, και
- Η Δανία με πιθανότητα νίκης 55% έναντι της Αυστραλίας
Να σημειώσουμε ότι το μοντέλο δεν λαμβάνει υπόψη του τυχόν σκοπιμότητες ή επιπλέον ενδιαφέρον που έχουν κάποιες ομάδες για πρόκριση στον επόμενο γύρο.
Τέλος έχουμε άλλους τρεις αγώνες όπου το φαβορί έχει ελαφρυ προβάδισμα με πιθανότητα νίκης μεταξύ 40% και 50%. Συγκεκριμένα έχουμε τους αγώνες
- Βέλγιο-Κροατία (43% vs. 26%) με την ισοπαλία επίσης αρκετά πιθανή.
- Μεξικό-Σαουδική Αραβία (44% vs 24,3%) με την ισοπαλία επίσης αρκετά πιθανή, και
- Βέλγιο-Κροατία (47 vs 27%)
Πίνακας 1: Πιθανότητες Αποτελεσμάτων για τη 3η Αγωνιστική με βάση το Μοντέλο Μπευζιανής Στατιστικής Μηχανικής Μάθησης της Ερευνητικής ομάδας AUEB Sports Analytics
Αγώνας |
Φαβορί |
Αουτσάιντερ |
Νίκη για το φαβορί |
Ισοπαλία |
Νίκη για το Αουτσάιντερ |
1 |
Ecuador |
Senegal |
0.389 |
0.302 |
0.309 |
2 |
Netherlands |
Qatar |
0.767 |
0.160 |
0.073 |
3 |
United States |
Iran |
0.402 |
0.297 |
0.301 |
4 |
England |
Wales |
0.624 |
0.236 |
0.140 |
5 |
France |
Tunisia |
0.643 |
0.236 |
0.122 |
6 |
Denmark |
Australia |
0.546 |
0.274 |
0.180 |
7 |
Argentina |
Poland |
0.658 |
0.229 |
0.112 |
8 |
Mexico |
Saudi Arabia |
0.436 |
0.322 |
0.243 |
9 |
Belgium |
Croatia |
0.470 |
0.260 |
0.270 |
10 |
Morocco |
Canada |
0.428 |
0.313 |
0.259 |
11 |
Spain |
Japan |
0.575 |
0.251 |
0.175 |
12 |
Germany |
Costa Rica |
0.646 |
0.224 |
0.130 |
13 |
Portugal |
South Korea |
0.611 |
0.236 |
0.153 |
14 |
Uruguay |
Ghana |
0.681 |
0.208 |
0.111 |
15 |
Switzerland |
Serbia |
0.393 |
0.284 |
0.322 |
16 |
Brazil |
Cameroon |
0.796 |
0.162 |
0.041 |
Στο Διάγραμμα 1 μπορείτε να δείτε τις πιθανότητες για το κάθε σκορ για καθένα από τους 16 αγώνες της 3ης αγωνιστικής.
Διάγραμμα 1: Διάγραμμα Πιθανοτήτων πιθανών σκορ για τους Αγώνες της 2ης αγωνιστικής του Παγκοσμίου Κυπέλου 2022.
Βιβλιογραφία για διαβαστερούς φιλάθλους
- Dixon, M.J. and Coles, S.G. (1997), Modelling Association Football Scores and Inefficiencies in the Football Betting Market. Journal of the Royal Statistical Society: Series C (Applied Statistics), 46, 265-280.
- Karlis, D. and Ntzoufras, I. (2003), Analysis of sports data by using bivariate Poisson models. Journal of the Royal Statistical Society: Series D (The Statistician), 52, 381-393.
- Lee A.J. (1997). Modeling Scores in the Premier League: Is Manchester United Really the Best? Chance, 10, 15-19.
- Maher, M.J. (1982), Modelling association football scores. Statistica Neerlandica, 36, 109-118.
- Reep, C., & Benjamin, B. (1968). Skill and Chance in Association Football. Journal of the Royal Statistical Society. Series A (General), 131, 581-585.
Οι Μαγικές Εξισώσεις του στατιστικού μοντέλου
- i είναι ο δείκτης του αγώνα
- Xiκαι Yi είναι ο αριθμός των γκολ μεταξύ της 1ης και της 2ης ομάδας στον αγώνα i
- hi και ai είναι η 1η και 2η ομάδα αντίστοιχα (ή η εντός και εκτός έδρα ομάδα – όπου ισχύει) για τον i αγώνα.
- attk,t και defk,t οι παράμετροι που εκτιμούν της επιθετική και αμυντική δυναμικότητα/ ικανότητα της ομάδας k την χρονική στιγμή t (δυναμικές παράμετροι που αλλάζουν στο χρόνο)
- rankingk δείκτης Coca-Cola FIFA ranking την 6η Οκτωβρίου 2022 για την ομάδα k.
Λίγα λόγια για τους Συγγραφείς
O Leonardo Egidi είναι επίκουρος καθηγητής Στατιστικής στο Πανεπιστήμιο της Τεργέστης στην Ιταλία και μέλος της ερευνητικής ομάδας του Οικονομικού Πανεπιστημίου Αθηνών AUEB Sports Analytics Group. Έχει διδακτορικό στην μοντελοποιηση και αναλυτική ποδοσφαίρου και έντονη ερευνητική δραστηριότητα στη Μπευζιανή Στατιστική μεθοδολογία.
O Βασίλης Παλάσκας είναι Στατιστικός Αναλυτής και Επιστήμονας Δεδομένων στην Fantasy Sports Interactive (FSI). Είναι ενεργό μέλος της ερευνητικής ομάδας AUEB Sports Analytics από το 2019 όπου τελείωσε το M.Sc. in Statistics του Οικονομικού Πανεπιστημίου Αθηνών.
O Ιωάννης Ντζουφρας είναι καθηγητής Στατιστικής και πρόεδρος στο Τμήμα Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών. Είναι ιδρυτικό μέλος της ερευνητικής ομάδας AUEB Sports Analytics Group μαζί με τον Δημήτρη Καρλή. Έχει αναγνωρισμένη επιστημονική δραστηριότητα σε τομείς όπως η Μπευζιανή στατιστική μεθοδολογία, υπολογιστική στατιστική, Βιοστατιστική, ψυχομετρία και αναλυτική των σπορ.
O Δημήτρης Καρλής είναι καθηγητής Στατιστικής και αναπληρωτής πρόεδρος στο Τμήμα Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών. Είναι ιδρυτικό μέλος της ερευνητικής ομάδας AUEB Sports Analytics Group μαζί με τον Ιωάννη Ντζούφρα. Έχει αναγνωρισμένη επιστημονική δραστηριότητα σε τομείς όπως η στατιστική μεθοδολογία, υπολογιστική στατιστική, Βιοστατιστική, και αναλυτική των σπορ.
Ενεργές Συνεργασίες των Συγγραφέων
Οι τρεις συγγραφείς (L. Egidi, Ι. Ντζούφρας και Δ. Καρλής) του άρθρου αυτή τη στιγμή συνεργάζονται για τη συγγραφή ενός βιβλίου σε Football Analytics σε διεθνή επιστημονικό οίκο ενώ στο τελευταίο workshop της ομάδας έδωσαν ένα σεμιναριακό μάθημα σε Football analytics.
Ο L. Egidi και Β. Παλάσκας συνεργάζονται στην ανάπτυξη του λογισμικού “footbayes” (βιβλιοθήκη της στατιστικής γλώσσας προγραμματισμού R).
Ο L. Egidi, Ι. Ντζούφρας και Β. Παλάσκας συνεργάζονται στην συγγραφή ενός επιστημονικού άρθρου αξιολόγησης παικτών στο Βόλεϊ.
Ο Ι. Ντζούφρας και Β. Παλάσκας συνεπιβλέπουν μια διπλωματική εργασία στα πλαίσια του M.Sc. in Statistics του ΟΠΑ και της συνεργασίας με την FSI (Fantasy Sports Interactive)