Depuis un certain temps, j’avais l’intention d’apprendre comment faire des résumés de match basés sur des statistiques et datavisualisations; c’est un outil très courant pour l’exploration et l’analyse des performances et tactiques. Ce type de dashboard – voir par exemple les versions qu’en ont fait Ben Griffis, Footballytics, et John (@totalf0otball), qui sont un peu plus avancées que la mienne – utilise des statistiques générales du match telles que le taux de possession de balle (%), et surtout les event data (par ex. chaque tir, passe, dribble ou action défensive, avec leur localisation sur le terrain, l’émetteur et le destinataire, etc.), pour mettre en évidence les principales tendances de jeu et certains indicateurs de performance pour un match donné.
J’ai pris comme exemple le match spectaculaire entre Chelsea et Manchester City en Premier League le 12 novembre 2023, en utilisant cette page WhoScored qui inclut les event data d’Opta. J’ai d’abord dû extraire toutes les données pertinentes du code html, puis traiter et préparer les données en sélectionnant notamment les passes, les tirs, les buts et les actions défensives de chaque équipe.


Voici une brève explication des mesures et des visualisations de données incluses dans le tableau de bord. Le réseau de passes montre la position moyenne de chaque joueur et la fréquence des passes avec ses coéquipiers ; les cartes de passes montrent les passes dans des zones spécifiques (dernier tiers ; surface de l’adversaire) que chaque équipe a tentées (les passes réussies sont en vert). PPDA, c’est-à-dire « passes adverses autorisées par action défensive », mesure le nombre de passes que chaque équipe « autorise » dans la moitié de terrain adverse avant d’intervenir par un tacle, une interception, etc. C’est principalement une manière d’évaluer l’intensité du pressing par chaque équipe dans la moitié adverse.
La modélisation statistique de l’impact des actions sur la probabilité de marquer – désignée en anglais comme « expected threat » – est actuellement le meilleur moyen d’obtenir une vue d’ensemble de la contribution offensive, comme l’explique ici l’équipe de Footballytics.

L’inclinaison du terrain – field tilt – est utile pour évaluer quelle équipe est la plus dominante dans les matches, car elle donne une image plus claire de la domination territoriale en situation de possession. Elle permet de savoir si une équipe domine dans les zones qui comptent (pour marquer des buts) – en d’autres termes, elle mesure la part de possession d’une équipe dans le tiers offensif – plutôt que de mettre uniquement l’accent sur la statistique traditionnelle du pourcentage de possession.
Rapport/Résumé du match

Et voici le rapport pour un autre match, la rencontre entre l’Ajax et l’OM en Europea League, le 30 novembre.

Mise à jour (janvier 2024)
Whoscored fournit des données pour une série de championnats et de compétitions qui est déjà très utile, mais il y a aussi des données Opta accessibles sur le site Web Scoresway.com (on peut y trouver des données de match complètes pour des dizaines de pays de première division et, dans certains pays, également de divisions inférieures, ainsi que pour le football féminin). J’ai mis mon code d’extraction et de traitement des données sur Github : il permet de recueillir les informations, les statistiques et les event data pour un match donné. L’étape suivante consistait à adapter mon modèle pour les tableaux de bord des matchs, puisque le modèle original était basé sur le code source de Whoscored. Cela a pris du temps mais je suis heureux d’avoir persévéré, car je peux maintenant facilement créer une version améliorée de la première version de mon tableau de bord (ci-dessus). Je l’ai également personnalisé pour l’améliorer visuellement et pour attirer l’attention sur les données pertinentes !


