Euro Predictions Day 1

Προβλέψεις για το ΕΥΡΩΠΑΪΚΟ ΠΡΩΤΑΘΛΗΜΑ ΠΟΔΟΣΦΑΙΡΟΥ 2024 βασισμένες σε Στατιστικά Μοντέλα Αναλυτικής Ποδοσφαίρου

Ήρθε η ώρα του Ευρωπαϊκού πρωταθλήματος 2024 που φέτος διεξάγεται στη Γερμανία, ένα πρωτάθλημα με ιδιαίτερο ενδιαφέρον από πολλές απόψεις. "EURO 2024 θα είναι το παιχνίδι μας" είναι το σύνθημα του καλοκαιριού για το Βερολίνο, ελπίζοντας όχι μόνο να φιλοξενήσει ένα επιτυχημένο Ευρωπαϊκό Πρωτάθλημα Ποδοσφαίρου αλλά να δημιουργήσει ένα θετικό αντίκτυπο στην κοινότητα και να θέσει ένα πρότυπο για μελλοντικές εκδηλώσεις με έμφαση στην προστασία του κλίματος, την καταπολέμηση των διακρίσεων και την ενσωμάτωση. Αλλά ας μεταφερθούμε στο αγωνιστικό κομμάτι…

Πολλοί υποστηρίζουν ότι είναι δυσκολότερο να κατακτήσει μια ομάδα το Ευρωπαϊκό Πρωτάθλημα παρά το Παγκόσμιο Κύπελλο. Κι αυτό, καθώς ο ανταγωνισμός είναι μεγαλύτερος, στην τελική φάση της Ευρωπαϊκής διοργάνωση δεν υπάρχουν πιο «μικρές» ομάδες και όλοι γνωρίζονται πολύ καλά μεταξύ τους. Από την άλλη, για τον ίδιο λόγο υπάρχουν μεγαλύτερα περιθώρια έκπληξης (πχ., EURO 2004). Ένα ενδιαφέρον στοιχείο ακόμα είναι ότι μόνο τρεις φορές ιστορικά η διοργανώτρια χώρα κατέκτησε τον τίτλο, με την τελευταία το 1984! Επομένως, θα έχει ενδιαφέρον τόσο η πορεία πιο μικρών ομάδων, όπως η Γεωργία που κάνει το ντεμπούτο της στα τελικά, όσο και το αν «στο τέλος θα κερδίσουν οι Γερμανοί». Παρ’ όλα αυτά, εμείς είμαστε μια ομάδα απλών στατιστικών που μας αρέσει το ποδόσφαιρο, οπότε καλύτερα ας κολυμπήσουμε στα δικά μας νερά από εδώ και στο εξής.

Η χρήση στατιστικών τεχνικών για την πρόβλεψη αγώνων ποδοσφαίρου πρώτο-εμφανίστηκε στην επιστημονική βιβλιογραφία το 1968 με την πρωτοπόρα επιστημονική δημοσίευση των Reep & Benjamin. Οι επόμενες πραγματικές καινοτομίες εμφανίζονται στη δεκαετία του 80 (με την εργασία του Michael Maher) και τη δεκαετία του 90 (με την εργασία του Lee το 1997). Οι πρώτες όμως σημαντικές δημοσιεύσεις στο χώρο, εισάγοντας μοντέλα στα οποία βασίζονται και μοντέλα που χρησιμοποιούμε ακόμα και σήμερα, ήταν οι εργασίες των Dixon & Coles το 1997 και το διμεταβλητό μοντέλο Poisson των Καρλή και Ντζούφρα το 2003 (δύο από τους συγγραφείς της συγκεκριμένης ανάλυσης). Τα δύο αυτά μοντέλα έθεσαν τη βάση των συγχρόνων μοντέλων πρόβλεψης των αποτελεσμάτων αγώνων ποδοσφαίρου.

Σε αυτή την ανάλυση χρησιμοποιούμε το μοντέλο των Καρλή και Ντζούφρα μέσω του πακέτου “footbayes” στη στατιστική γλώσσα προγραμματισμού R που έχουν αναπτύξει ο Καθηγητής Leonardo Egidi από το Πανεπιστήμιο της Τεργέστης με τη συνδρομή του Βασίλη Παλάσκα (Αναλυτής στην Open Bet και ενεργό μέλος του AUEB Sports Analytics Group). Το μοντέλο επίσης συμπεριλαμβάνει την εκτίμηση παραμέτρων που εκτιμούν την απόδοση κάθε ομάδας που αλλάζουν στον χρόνο. Για την εκμάθηση του μοντέλου χρησιμοποιήθηκαν όλοι οι διεθνείς αγώνες της περιόδου 2020-2024. Κύρια επεξηγηματική μεταβλητή είναι η διαφορά μεταξύ των δύο ομάδων στο δείκτη Coca-Cola/FIFA ranking.  Το μοντέλο, που προτάθηκε για πρώτη φορά από τους Καρλή & Ντζούφρα το 2003, επεκτείνει το συνηθισμένο διμεταβλητό μοντέλο Poisson.  Λεπτομέρειες για το μοντέλο στατιστικής και μηχανικής μάθησης που χρησιμοποιήθηκε θα βρείτε στο τέλος του άρθρου.

Μπορείτε να δείτε το πλήρες άρθρο εδώ.