La RTBF a opté pour une virtualisation des données en appui sur la solution de Denodo

Data / IA

La RTBF maîtrise sa data avec Denodo

Par Alain Clapaud, publié le 08 août 2023

Le groupe audiovisuel public belge est parvenu à gérer la complexité de son SI grâce à la virtualisation des données. Une approche qui démontre autant sa pertinence comme data hub entre applications que pour préparer la généralisation et la démocratisation du big data.

Si l’activité de base de la RTBF reste la production et la diffusion de contenus audiovisuels pour ses chaînes TV et radio, comme tous les grands groupes audiovisuels, l’entreprise publique belge fait face à une multiplication de ses médias, avec l’essor de ses sites internet, de ses applications mobiles et des médias sociaux. « Cette diversité a un énorme impact sur l’IT », explique Jean-Pierre Hoedenaeken, architecte de données & manager business intelligence chez RTBF. « Une des caractéristiques de notre système d’information réside dans cette multitude d’applications présentes, avec des technologies sous-jacentes souvent différentes, du Microsoft SQL Server, de l’Oracle, du SAP Hana, du RedShift, etc. Nous avons donc de gros besoins d’intégration au niveau opérationnel, mais également en matière de reporting, pour pouvoir consolider et croiser ces données qui viennent d’horizons différents. »

Un modèle virtuel performant

Pour faire face à cette diversité, l’architecte s’est intéressé à la solution de virtualisation des données de Denodo, qui repose sur une approche qu’il avait déjà mise en œuvre avec le Logical Data Warehouse de la solution de reporting Oracle BI (devenue depuis Oracle Analytics). « Denodo reprend cette notion de couche sémantique afin de fédérer des sources de données de natures différentes. Cela permet de masquer la complexité du système d’information tout en permettant des accès en quasi-temps réel suivant les besoins. C’est la solution parfaite pour ce type d’approche. »

Avec une douzaine de chaînes TV, radio et de médias numériques à supporter, la direction des technologies de RTBF a choisi le moteur de virtualisation Denodo pour exposer une vue unique des données issues de ces sources multiples.

L’architecte estime que l’ajout d’une couche de virtualisation sur les sources de données n’a pas véritablement impacté les performances. « Le moteur Denodo est optimisé pour déléguer les traitements aux bases de données sous-jacentes et ainsi maintenir des temps de réponse acceptables. Et lorsqu’on est malgré tout confronté à un problème de performance, on peut toujours placer des données en cache. »
Jean-Pierre Hoedenaeken a recours à cette possibilité pour améliorer les temps de réponse et lorsqu’il n’est pas indispensable d’accéder à des données en temps réel, comme c’est notamment le cas des accès à l’Active Directory.


À LIRE AUSSI :

Un déploiement progressif

Ce déploiement s’inscrit dans un cadre plus général de digitalisation des processus internes du groupe, avec la mise en place d’un cluster data commun entre les ressources issues de l’IT et celles de la direction des données. Le groupe dispose à la fois d’un data warehouse Oracle pour toutes ses données structurées, et d’un data lake pour capter toutes les informations de consommation des contenus sur les différents environnements. Ce data lake est porté par AWS via les services S3 et RedShift.

Le projet a été mené de manière progressive, en fonction des besoins exprimés. « Ainsi, l’année dernière, nous avons dû intégrer une nouvelle application SaaS dans notre système d’information. Nous en avons alors profité pour exposer ses données au travers de Denodo. L’un des gros avantages, c’est que ces interconnexions sont réalisées par API et nous pouvons facilement exposer les données qui sont demandées par notre partenaire éditeur. Nous n’avons plus aucun problème d’intégration de notre côté », explique l’architecte.

Des accès « temps réel », mais aussi pour l’analytique

Chez RTBF, Denodo doit non seulement répondre aux besoins d’échanges de données inter-applicatifs, mais aussi répondre aux besoins des métiers. « La plateforme donne aux utilisateurs métiers des accès à des informations de qualité et qui ont du sens pour eux. Elle joue un rôle de “Single Version of the Truth”. Côté IT, lorsqu’on regarde l’architecture de Denodo, cela ressemble fort à un data hub qui va permettre d’éliminer de nombreuses connexions point à point entre applications. »

Lors du déploiement, l’un des chantiers a d’ailleurs consisté à mettre en place la brique master data management (MDM) dont le groupe ne disposait pas encore. Celle-ci est toujours en cours de construction, mais Jean-Pierre Hoedenaeken souligne que le data catalog de Denodo est d’une autre nature : « Pour moi, il s’agit surtout d’un data product catalog. L’objectif est d’y exposer les informations pour les utilisateurs dans les directions métiers, toutes les vues exposées via Denodo, et de retrouver l’information recherchée à partir de mots-clés, par exemple. »


À LIRE AUSSI :

Deux directions métiers sont plus particulièrement demandeuses de l’accès aux données : les ressources humaines et les services généraux. Ainsi, fin 2022, le projet de remplacement du système de paye on-premise par une solution SaaS a pu bénéficier à plein des capacités de Denodo. « Toutes les requêtes que nous avions écrites pour notre application Oracle ont été transformées en vues Denodo et peuvent être appelées par des services web. Ces vues métiers peuvent aujourd’hui être réemployées pour répondre à d’autres besoins et faire des assemblages de vues selon les besoins, sans avoir à tout réinventer à chaque fois. Ces vues peuvent aussi être réutilisées directement par Oracle Analytics. »

Jean-Pierre Hoedenaeken,
Architecte de données & manager business intelligence chez RTBF

« Il faut des data products en phase avec les besoins des métiers. La virtualisation des données permet de les exposer de la manière la plus facile à appréhender par les utilisateurs. »

Il y a par ailleurs un important volet big data, notamment pour l’analyse des données d’audience. « Nous déployons de plus en plus de sources de données sur ce data lake et sur le data warehouse au travers de Denodo pour ensuite faire du reporting. »
Ainsi, le projet de moteur de recommandation de contenus, au sein de l’application Auvio comme sur les plateformes numériques, va exploiter des données de type CRM stockées dans le cluster data.

Le groupe capitalise sur cette infrastructure En parallèle à la mise en place de cette architecture technique, l’équipe data mène une action en matière de gouvernance, avec la nomination de data owners et de data stewards, et pour sensibiliser les métiers sur l’importance de la qualité des données et des métadonnées. L’enjeu est de taille car la tendance globale est à l’exposition des données stockées par RTBF dans son data lake et son data warehouse pour les mettre à disposition d’un plus grand nombre d’utilisateurs métiers. « Le nouveau projet de solution de planification des ressources humaines et matérielles pour nos activités de production va tirer profit de l’approche Denodo. Celle-ci va piocher des données dans plusieurs référentiels (RH, matériels, locaux, véhicules, etc.) en lien avec le MDM. Denodo devrait pouvoir répondre à ce besoin sans peine. »


LE PROJET EN CHIFFRES

50 To pour le data lake

25 sources de données connectées

15 utilisateurs métiers


L’ENTREPRISE RTBF

Activité : Audiovisuel
Effectif : 1 970 collaborateurs
CA : 410 M€



À LIRE AUSSI :

Dans l'actualité

Verified by MonsterInsights