Data / IA
Roland Garros, un terrain de jeu idéal pour la data
Par Alain Clapaud, publié le 01 octobre 2024
C’est l’un des quatre tournois du Grand Chelem et le seul à se disputer sur terre battue. Le gratin du tennis mondial se retrouve chaque année Porte d’Auteuil pour disputer Roland Garros. Mais avec les réseaux sociaux, les App et le Web, ce grand rendez-vous annuel a aussi lieu sur le digital, le terrain de prédilection des technologies IT les plus avancées.
Ces dernières années, la data est omniprésente dans tous les sports médiatisés et le tennis ne fait pas exception. Sur le Web, il est possible de connaître à tout moment les statistiques de jeu de son joueur préféré, de suivre la progression de Carlos Alcaraz au classement ATP, ou de savoir que le meilleur serveur actuel n’est pas Djokovic, mais le polonais Hubert Hurkacz.
Pour Jérémie Thomas, manager digital à la Fédération Française de Tennis, le digital est désormais incontournable pour la promotion d’un tournoi du grand chelem tel que Roland Garros : « Nous comptons une dizaine de millions de visiteurs sur notre site lors du tournoi, et le digital est un outil indispensable pour engager les fans, les faire revenir sur nos plateformes digitales et les convaincre de venir assister aux matchs sur les courts. Nous disposons de notre propre infrastructure de collecte des données sous le stade Philippe Chatrier. Ces données sont mises à disposition de notre partenaire Infosys afin de les partager auprès des fans et des teams des joueurs à l’échelle mondiale. »
Depuis la trajectoire de la balle, sa vitesse de rotation, les rebonds, les déplacements des des joueurs à tout instant et bien évidemment les scores, tout ce qui des joueurs à tout instant et bien évidemment les scores, tout ce qui se passe sur le terrain est tracé et génère des données.
Présent dans le monde du tennis depuis neuf années et depuis six ans auprès de la FFT à Roland Garros, Infosys gère cette infrastructure data hors normes.
« En 2014, l’ATP s’est tournée vers nous afin de mieux utiliser toutes les données sur chaque point joué dans le monde », explique Navin Rammohan, vice-président en charge du marketing, des solutions business verticales, du sponsorship et des événements chez Infosys. « Ces data sur les matchs étaient centralisées dans un datacenter en Floride et ils nous ont demandé de les valoriser. »
Une plateforme hébergée par AWS
S’appuyant sur un historique de cinq années, Infosys a mis en place une infrastructure complète baptisée Infosys Sports Platform. Elle s’appuie sur sa plateforme de services Infosys Cobalt hébergée par AWS, dont de nombreux services sont par ailleurs utilisés. Cette plateforme porte plusieurs applications qui viennent exploiter les données brutes.
La plus connue est Leaderboard de l’ATP, un service web et une application tous deux destinés au grand public. Les fans peuvent consulter les statistiques de tous les joueurs du circuit, avec de multiples critères de tri, dont celui du meilleur serveur, du meilleur retourneur ou encore celui qui joue le mieux sous la pression en fonction du type de surface.

L’édition 2024 du tournoi de Roland Garros marque la fin des travaux de rénovation qui ont été lancés en 2015. Avec la construction du nouveau court Suzanne Mathieu dans les Serres d’Auteuil, le stade compte désormais 18 courts de tennis, autant de terrains qui ont alimenté la plateforme data d’Infosys pendant la quinzaine.
Ce n’est que la partie émergée de l’iceberg, car il ne s’agit que de données agrégées. Les joueurs et leurs équipes peuvent accéder à un portail spécifique bien plus riche. Leurs coachs y disposent de l’ensemble des données relatives à leur joueur, mais aussi à celles de ses adversaires dont ils souhaitent analyser le jeu avant un match. Une IA vient générer des extraits vidéo de dix secondes correspondant aux requêtes de l’entraîneur pour visualiser tel ou tel coup d’un joueur sur telle ou telle surface. Une visualisation en split screen permet d’observer dans le détail les services et coups gagnants de l’adversaire.
Ce sont les modèles open source Grounding Dino et ViTPose qui permettent d’identifier les séquences en question dans les flux vidéo. Et chaque année, de nouvelles fonctionnalités sont proposées au sein de cette application, avec récemment par exemple un calculateur d’empreinte CO2 qui aide le joueur à optimiser ses voyages afin de réduire son impact environnemental.
Jérémie Thomas
Manager digital chez Fédération Française de Tennis
« Le digital est un outil indispensable pour engager les fans, les faire revenir sur nos plateformes digitales et les convaincre de venir assister aux matchs sur les courts. »
Des flux de données hétérogènes
La plateforme se caractérise par la grande hétérogénéité des flux de données qui l’alimentent. Il y a des données structurées et les flux vidéo des matchs. Ceux-ci sont reçus par le service AWS Elemental MediaLive via le protocole RTMP (Real- Time Messaging Protocol) et stockés dans des buckets S3. Ils sont traités ensuite avec AWS Elemental MediaConvert et exposés par Lambda API.
Via cette API, un coach peut demander à visionner un extrait de match en fonction d’une requête précise. Ces images sont aussi analysées par des algorithmes de machine learning développés par Infosys.

Infosys met en oeuvre de nombreuses briques serverless pour alimenter la plateforme dédiée au sport. De multiples algorithmes analysent les vidéos puis toutes les données des matchs sont diffusées auprès des fans sur le site de l’ATP ou à destination des joueurs et de leurs coachs.
Exécutés sur AWS Lambda, les algorithmes extraient les images clés du flux vidéo qui sont stockées sur Amazon ECR (Elastic Container Registry). Ils peuvent notamment évaluer le niveau d’enthousiasme de la foule ou l’image retournée par le système Hawk-Eye lorsqu’un point est litigieux.
Toutes ces métadonnées sont stockées dans une base de données PostgreSQL Amazon Aurora Serverless.
Outre les flux vidéo, de multiples données collectées sur le terrain sont ingérées dans la plateforme : c’est le cas du score saisi par l’arbitre sur sa tablette numérique pendant le match, la position des joueurs, la trajectoire de la balle, etc. Elles convergent en quasi temps-réel via la brique de traitement des flux de données Amazon Kinesis.
Un serveur TCP exécuté sur AWS Fargate assure la réception des données et celles-ci sont immédiatement traitées par des fonctions Lambda avant leur stockage sur Aurora.
Tous les services AWS choisis par les architectes d’Infosys sont de type serverless. L’avantage d’une plateforme 100 % serverless est sa capacité à monter en charge, notamment en début de tournoi quand un grand nombre de matchs sont joués en parallèle. Le pipeline d’ingestion peut traiter jusqu’à un million d’événements lors d’un tournoi majeur.
Et même si l’Infosys Sports Platform est un cas atypique d’usage de la data, les solutions imaginées par les ingénieurs d’Infosys pour collecter ces flux de données hétérogènes, les traiter et les faire analyser par des IA peuvent s’avérer pertinentes dans d’autres secteurs où la compétition peut être très élevée aussi !
Le projet en chiffres
5,35 millions de visiteurs sur le Match Center Infosys lors de Roland Garros
15 millions de pages vues
4 900 vues pour l’application Roland Garros pour les joueurs
24 mn de moyenne pour les sessions vues par les joueurs
L’entreprise
Activité : Evénementiel (sportif)
Effectif : 4 700 collaborateurs lors de l’événement
CA : 338 M€ (Estimation 2024)
À LIRE AUSSI :
À LIRE AUSSI :
À LIRE AUSSI :
À LIRE AUSSI :
