Το EURO2020 εξελίσσεται ως η διοργάνωση των εκπλήξεων και των μεγάλων σκορ.

Το μοντέλο κατάφερε να εντοπίσει επιτυχώς την καλή και αποτελεσματική επίδοση του Βελγίου και της Αγγλίας.

Επίσης προέβλεψε ότι ο αγώνας της Ισπανίας με την Κροατία θα ήταν αμφίρροπο (με μικρό προβάδισμα της Ισπανίας όπως και προέκυψε στην παράταση).

Η Ιταλία δυσκολεύτηκε αλλά τελικά πέρασε ενώ στους άλλους αγώνες είχαμε εκπλήξεις οι οποίες ήταν δύσκολες να προβλεφθούν από το μοντέλο ή από experts του αθλήματος. Οι λεπτομέρειες και η ταυτότητα του μοντέλου δίνεται στο τέλος του άρθρου.

Oι προβλέψεις για την φάση των 16 εδώ.

Οι Προβλέψεις του Μοντέλου για την προ-ημιτελική φάση

Οι προβλέψεις του μοντέλου συνοψίζονται στον Πίνακα που ακολουθεί. Μαζί με τις πιθανότητες κάθε αποτελέσματος δίνεται και το σκορ με την μεγαλύτερη πιθανότητα εμφάνισης (η αντίστοιχη πιθανότητα δίνεται σε παρένθεση) και το αναμενόμενο σκορ βασισμένο στον αναμενόμενο αριθμό γκολ στρογγυλοποιημένο προς τον κοντινότερο ακέραιο.


Με βάση τα παραπάνω αποτελέσματα βλέπουμε ότι η ότι όλοι αγώνες φαίνονται αμφίρροποι με τις ομάδες να είναι κοντά. To Βέλγιο έχει ελαφρύ προβάδισμα νίκης επί της Ιταλίας με πιθανότητα νίκης 54% ενώ η πιθανότητα να πάει ο αγώνας στην παράταση ή να νικήσει η Ιταλία είναι πολύ κοντά και ίση με 46%. Αντίστοιχη, είναι η εικόνα του αγώνα Ουκρανίας-Αγγλίας. Η Αγγλία έχει ένα μικρό προβάδισμα νίκης με 56% ενώ η Ουκρανία μπορεί να πάει τον αγώνα στην παράταση ή να νικήσει με πιθανότητα συνολικά 44%. Ο αγώνας Δανίας-Τσεχίας μοιάζει πιο αμφίρροπος από τους δυο προηγούμενους αγώνες με πιθανότητα νίκης για τη Δανία ίση με 46% και πιθανότητα παράτασης ή νίκης  της Τσεχίας συνολικά 54%. Τέλος ο πιο αμφίρροπος αγώνας με βάση το μοντέλο είναι ο αγώνας Ελβετίας-Ισπανίας με την Ισπανία να έχει πολύ μικρό προβάδισμα με πιθανότητα νίκης 39.7% (η εικόνα πρόβλεψης είναι παρόμοια με αυτόν του Αγώνα Κροατίας-Ισπανίας). Εν κατακλείδι, όλοι οι αγώνες φαίνονται να μην έχουν ξεκάθαρο νικητή και όλα είναι πιθανά ειδικά σε μια διοργάνωση όπως η φετινή.  

Στα ακόλουθα διαγράμματα απεικονίζονται οι πιθανότητες κάθε σκορ για κάθε αγώνα. Τα πιο σκούρα κουτάκια απεικονίζουν τα πιο πιθανά αποτελέσματα ενώ τα πιο ανοικτόχρωμα υποδεικνύουν αποτελέσματα με χαμηλή πιθανότητα εμφάνισης.

Οι προβλέψεις γίνονται για επιστημονικούς λόγους και δεν συνιστούν προτροπή ή συμβουλή για στοιχηματισμό.

Βιβλιογραφία για διαβαστερούς φιλάθλους

·         Dixon, M.J. and Coles, S.G. (1997), Modelling Association Football Scores and Inefficiencies in the Football Betting Market. Journal of the Royal Statistical Society: Series C (Applied Statistics), 46, 265-280.

·         Karlis, D. and Ntzoufras, I. (2003), Analysis of sports data by using bivariate Poisson models. Journal of the Royal Statistical Society: Series D (The Statistician), 52, 381-393.

·         Lee A.J. (1997). Modeling Scores in the Premier League: Is Manchester United Really the Best?  Chance, 10, 15-19.

·         Maher, M.J. (1982), Modelling association football scores. Statistica Neerlandica, 36, 109-118.

·         Reep, C., & Benjamin, B. (1968). Skill and Chance in Association Football. Journal of the Royal Statistical Society. Series A (General), 131, 581-585.

Η ταυτότητα του μοντέλου

Η τεχνική αλλά και τέχνη στατιστικής μοντελοποίησης  έχει άμεση εφαρμογή στον τομέα του αθλητισμού και πιο συγκεκριμένα του ποδοσφαίρου με άμεση εφαρμογή στην λήψη αξιόπιστων προβλέψεων σε μελλοντικούς αγώνες ποδοσφαίρου όπου το ενδιαφέρον των φιλάθλων αυξάνει κατακόρυφα.

Η χρήση στατιστικών τεχνικών για την πρόβλεψη αγώνων ποδοσφαίρου πρώτο-εμφανίστηκε στην επιστημονική βιβλιογραφία το 1968 με την πρωτοπόρα επιστημονική δημοσίευση των Reep & Benjamin. Οι επόμενες πραγματικές καινοτομίες εμφανίζονται στη δεκαετία του 80 με την εργασία του Michael Maher και την εργασία του Lee το 1997  όπου έθετε το ερώτημα αν πράγματι η Μάντσεστερ Γιουνάιτεντ τότε ήταν πράγματι η καλύτερη ομάδα. Το ερώτημα επιβεβαιώνονταν με την χρήση ενός απλοϊκού στατιστικού μοντέλου και προσομοίωσης. Η ανάλυση αυτή έθετε τα θεμέλια της σύγχρονης μοντελοποίησης στο Ποδόσφαιρο και στον αθλητισμό.  Επόμενες σημαντικές δημοσιεύσεις ήταν οι εργασίες των Dixon & Coles το 1997 και το διμεταβλητό μοντέλο Poisson των Καρλή και Ντζούφρα το 2003 (δύο από τους συγγραφείς της συγκεκριμένης ανάλυσης). Τα δύο αυτά μοντέλα έθεσαν τη βάση των συγχρόνων μοντέλων πρόβλεψης των αποτελεσμάτων αγώνων ποδοσφαίρου.

Η βασική ιδέα του στατιστικού μοντέλου των καθηγητών του ΟΠΑ Καρλή και Ντζούφρα βασίζεται σε μια επέκταση μια γνωστής κατανομής που ονομάζεται Poisson για την πρόβλεψη του αριθμού των γκολ που θα σκοράρει κάθε ομάδα. Ο προβλεπόμενος αριθμός γκολ γράφεται ως συνάρτηση της επίδρασης της έδρας (home effect) που πλέον μπορεί να ποσοτικοποιηθεί και της επιθετικής και αμυντικής δυναμικότητας  των ομάδων. Εδώ γίνεται χρήση μιας παραλλαγής αυτού του μοντέλου για να γίνει πρόβλεψη των αγώνων του EURO 2020. Επιπλέον χρησιμοποιούνται χρονό-δυναμικές παράμετροι που αντικατοπτρίζουν τις δυναμικότητες ομάδων και η διαφορά στο ranking μεταξύ των δύο αντίπαλων ομάδων με βάση τον δείκτη Coca-Cola FIFA ranking την 27η Μαΐου 2021. Το μοντέλο εκτιμήθηκε με χρήση της Μπευζιανής προσέγγισης (Bayesian approach) με του στατιστικών πακέτων R και STAN. Οι προβλέψεις αυτές είναι παρόμοιας ακρίβειας με αυτές που χρησιμοποιούν οι εταιρείες στοιχηματισμού.

·         i είναι ο δείκτης του αγώνα

·          και  είναι ο αριθμός των γκολ μεταξύ της 1ης και της 2ης ομάδας στον αγώνα i

·          είναι η επίδραση της έδρας (μόνο για τους αγώνες που ισχύει αυτό). Συνήθως στο EURO οι περισσότεροι αγώνες είναι σε ουδέτερη έδρα οπότε αυτό το bonus δεν προστίθεται σε καμία από τις δύο αντίπαλες ομάδες

·          και  είναι η 1η και 2η ομάδα αντίστοιχα (ή η εντός και εκτός έδρα ομάδα – όπου ισχύει) για τον i αγώνα.

·          και  οι παράμετροι που εκτιμούν της επιθετική και αμυντική δυναμικότητα/ ικανότητα της ομάδας k την χρονική στιγμή t (δυναμικές παράμετροι που αλλάζουν στο χρόνο)

·          δείκτης Coca-Cola FIFA ranking την 27η Μαΐου 2021 για την ομάδα k.

·          είναι η επίδραση του Coca-Cola FIFA ranking στο λογάριθμο των αναμενόμενων γκολ

Λίγα λόγια για τους Συγγραφείς

   O Leonardo Egidi είναι επίκουρος καθηγητής Στατιστικής στο Πανεπιστήμιο της Τεργέστης στην Ιταλία και μέλος της ερευνητικής ομάδας του Οικονομικού Πανεπιστημίου Αθηνών AUEB Sports Analytics Group. Έχει διδακτορικό στην μοντελοποιηση και αναλυτική ποδοσφαίρου και έντονη ερευνητική δραστηριότητα στη Μπευζιανή Στατιστική μεθοδολογία.

O Ιωάννης Ντζούφρας είναι καθηγητής Στατιστικής και πρόεδρος στο Τμήμα Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών. Είναι ιδρυτικό μέλος της ερευνητικής ομάδας AUEB Sports Analytics Group μαζί με τον Δημήτρη Καρλή. Έχει αναγνωρισμένη επιστημονική δραστηριότητα σε τομείς όπως η Μπευζιανή στατιστική μεθοδολογία, υπολογιστική στατιστική, Βιοστατιστική, ψυχομετρία και αναλυτική των σπορ.

O Δημήτρης Καρλής είναι καθηγητής Στατιστικής και αναπληρωτής πρόεδρος στο Τμήμα Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών. Είναι ιδρυτικό μέλος της ερευνητικής ομάδας AUEB Sports Analytics Group μαζί με τον Ιωάννη Ντζούφρα. Έχει αναγνωρισμένη επιστημονική δραστηριότητα σε τομείς όπως η στατιστική μεθοδολογία, υπολογιστική στατιστική, Βιοστατιστική, και αναλυτική των σπορ.

Οι τρεις συγγραφείς του άρθρου αυτή τη στιγμή συνεργάζονται για τη συγγραφή ενός βιβλίου σε Football Analytics σε διεθνή επιστημονικό οίκο ενώ στο τελευταίο workshop της ομάδας έδωσαν ένα σεμιναριακό μάθημα σε Football analytics.

Η ερευνητική ομάδα του Οικονομικού Πανεπιστημίου Αθηνών AUEB Sports Analytics Group ιδρύθηκε το 2015 από τους καθηγητές Ιωάννη Ντζούφρα και Δημήτρη Καρλή. Μέλη του είναι σημαντικά μέλη της κοινότητα της αναλυτικής των σπορ όπως οι Stefan Kesenne (Πανεπιστήμιο Antwerp & Leuven), Leonardo Egidi (Πανεπιστήμιο Trieste), Ιωάννης Κοσμίδης (Warwick), Κωνσταντίνος Πελεχρίνης (Pittsburg), Nial Friel (UCD) και Gianluca Baio (UCL) καθώς επίσης και ο πρώην προπονητής της εθνικής Ελλάδας Βόλεϊ, Σωτήρης Δρίκος. Η ερευνητική ομάδα είναι υπεύθυνη για της σειρά ετήσιων συνεδρίων με το όνομα AUEB Sports Analytics Workshop (5 συνολικά) ενώ το 2019 διοργάνωσε το διεθνές συνέδριο MathSport 2019 με 200 συμμετέχοντες επιστήμονες από όλο τον κόσμο. Τέλος η ομάδα έχει μια σειρά από σημαντικές επιστημονικές δημοσιεύσεις στο χώρο της αναλυτικής των σπορ.

 

Ακολουθήστε τον ot.grστο Google News και μάθετε πρώτοι όλες τις ειδήσεις
Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, στον ot.gr

Latest News

Πρόσφατα Άρθρα Academia
PODCAST Economics & Business TALKS – Γιώργος Μπάλτας: Marketing και επιχειρείν | Τα Social επηρεάζουν τις τιμές στην αγορά
Economics & Business Talks |

Γιώργος Μπάλτας: Πώς το διαδίκτυο και τα social media επηρεάζουν τις τιμές στην αγορά

Ο Γιώργος Μπάλτας είναι καθηγητής του Τμήματος Μάρκετινγκ και Επικοινωνίας του Οικονομικού Πανεπιστημίου Αθηνών. Διδάκτωρ της Σχολής Διοίκησης Επιχειρήσεων του Πανεπιστημίου του Warwick της Αγγλίας.