Des IA made in France : Branle-bas de combat pour une IA générative « libérée »

Data / IA

Branle-bas de combat pour une IA générative « libérée »

Par François Jeanne, publié le 23 novembre 2023

En recherche de souveraineté, ou tout du moins d’alternative à l’omniprésence d’OpenAI, les entreprises françaises se mettent en ordre de marche. Le mois dernier, Crédit Mutuel Arkéa, Veolia et Docaposte ont détaillé leurs initiatives. Et Xavier Neil a lancé la semaine dernière un labo expérimental, Kyutai.

La peur de la dépendance engendre la créativité pour s’en libérer, dit-on. Les derniers mois ont donc vu une accélération des initiatives autour de l’IA générative. Tout l’écosystème français s’est mis en marche avec, bien sûr, l’objectif de ne pas « louper le coche » face à la concurrence.

Une ambition qui se double, dans certaines DSI, de la volonté de ne pas se laisser enfermer une fois de plus – à l’instar du cloud par exemple – dans une situation où l’hégémonie des acteurs américains les rendraient totalement dépendantes des tarifs de ces derniers.

Parmi elles, le Crédit Mutuel Arkéa vient de dévoiler un modèle d’IA générative qu’il présente comme sobre en énergie et qu’il rend disponible en open source. Il a été conçu par le pôle “Innovation et Opérations” de la banque et son millier de collaborateurs, en charge notamment de l’ensemble de la prestation informatique du groupe. Celui-ci met en avant l’utilisation de la langue française pour ce modèle, en se référant explicitement au souhait exprimé par le ministre délégué au Numérique, Jean-Noël Barrot, début 2023, lors de la révision de la stratégie d’IA au niveau national.
Le data office du Pôle a travaillé sur des algorithmes de deep learning qui ont servi de fondations au modèle d’IA générative, maintenant disponible sur la plateforme de Hugging Face. « Nos équipes ont concentré leurs travaux sur une quarantaine d’expérimentations, telles qu’un chatbot en support des collaborateurs sur la base de corpus documentaires, la rédaction de synthèses et de documentation, ou encore la collecte de données extra-financières à partir de rapports, afin de s’assurer du contrôle de la donnée utilisée sur l’ensemble du processus », précise la banque.
Et elle insiste côté souveraineté en estimant que le partage de ce modèle en open source permettra à d’autres entreprises, notamment françaises, de mettre en oeuvre cette technologie en toute sécurité au sein de leurs structures.


À LIRE AUSSI :


De son côté, Veolia a surtout voulu mieux encadrer les usages naissants de l’IA générative parmi ses 220 000 collaborateurs, en leur proposant une application baptisée Veolia Secure GPT. Hébergée sur GCP, le cloud de Google, elle adresse des requêtes à Azure OpenAI Service, qui héberge les modèles GPT 3.5 et GPT 4.0 qu’exploite Veolia. Sa particularité est de s’enrichir de l’utilisation d’un autre moteur LLM d’OpenAI, text-embedding-ada, et d’utiliser une approche RAG (pour retrieval augmented generation) qui améliore les réponses des LLM en leur fournissant des sources de connaissances additionnelles, des PDF dans ce cas.

Si Veolia ne met pas en avant la dimension souveraine de son initiative, c’est tout le contraire de Docaposte, qui joue à fond son rôle de chef de file du projet de cloud souverain Numspot. La filiale de la Poste a travaillé ici avec LightOn pour les grands modèles de langage, a utilisé la plateforme collaborative spécialisée en IA Aleia et, bien sûr, Numspot pour l’hébergement certifié SecNumCloud. La première brique de cette solution d’IA générative, qui reste à baptiser, propose un agent conversationnel en langage naturel. La cible visée est ici celle des « acteurs publics et privés exploitant des données sensibles qui souhaitent accélérer leur transformation numérique et leur efficacité opérationnelle ».
Là encore, il est question des « enjeux d’autonomie stratégique en matière d’IA générative » et de fournir, sans les nommer, « une solution alternative aux offres existantes ».

Une idée bien française de l’indépendance ? Pas seulement : la CIA aussi développe une intelligence artificielle générative similaire à ChatGPT. Le chabot viendra assister les analystes de l’agence dans la collecte d’informations en ligne. Serait-elle inquiète des potentiels risques d’utilisation liés aux modèles d’OpenAI et consorts ?


Quand Xavier Niel s’en mêle

Xavier Niel, le charismatique PDG d’Iliad, a annoncé mi-novembre un investissement de 300 millions d’euros pour soutenir l’engagement de son groupe dans l’intelligence artificielle (IA) à travers trois piliers : un laboratoire nommé Kyutai, un supercalculateur et un service cloud. Ce projet a été présenté lors de l’événement “ai-Pulse” qui s’est tenu à la Station F, un lieu favori des start-ups parisiennes et dont Xavier Niel est le cofondateur.
Présenté comme le premier laboratoire de recherche européen indépendant dédié à l’Open Science en IA et cofondé par Xavier Niel, Rodolphe Saadé (PDG du Groupe CMA CGM) et Eric Schmidt (ancien CEO de Google), Kyutai est un projet à but non lucratif et vise à faire émerger un champion français de la recherche en IA. « Nous avons envie que nos enfants utilisent des algorithmes IA, des intelligences artificielles créées, inventées ici, avec nos spécificités. Pour nous, c’est la chose la plus importante car on ne veut pas dépendre de choses qui ont été inventées différemment avec d’autres règles » explique Xavier Niel. Avant d’ajouter, « la France et l’Europe ont 10 à 12 mois de retard sur les USA. Moins que ça j’espère. Mais il faut qu’on les rattrape ».
Comme OpenAI à sa naissance (bien avant ChatGPT ou la saga délirante de cette semaine), Kyutai veut promouvoir une approche ouverte de l’IA et compte mettre ses modèles à disposition de tous en open source.
Bien évidemment, Kyutai aura besoin de beaucoup de puissance pour former ses IA. Xavier Neil le sait bien. C’est pourquoi Scaleway, la filiale cloud du groupe Iliad a parallèlement annoncé mettre à disposition de Kyutai “la plus grande puissance de calcul déployée en Europe pour les applications IA“. Xavier Neil n’est pas entré dans le détail, mais il est fort probable que l’infrastructure mise à disposition ne soit autre que le supercalculateur Nabuchodonosor 2023 inauguré en octobre dernier, basé sur une architecture NVidia DGX SuperPOD et doté de 127 système DGX H100 (soit 1016 GPU H100).
Kyutai veut aussi former de futurs experts de l’IA générative, via l’accueil d’étudiants en master pour des stages au sein du laboratoire et la supervision de doctorants et de post-doctorants. 
La Deeptech est supervisée par un conseil scientifique composé de l’incontournable Yann Le Cun, Yejin Choi (lauréate 2022 de la bourse MacArthur) et Bernhard Schölkopf (directeur du Max Planck Institute).


Des initiatives qui se multiplient

Selon l’étude “Generative AI Benchmark Report” de Qlik, réalisée auprès de 200 dirigeants dans le monde:

>> 31 % des répondants disent prévoir de consacrer plus de 10 M$ à des projets d’IA générative au cours de l’année à venir.

>> 68 % projettent de s’appuyer sur des modèles du domaine public ou open source, affinés au moyen de données propriétaires.

>> 45 % envisagent de créer leurs modèles à partir de leurs propres données.

>> 20 % seulement pensent que leurs data fabrics sont bien ou très bien équipées pour répondre à leurs besoins en matière d’IA générative.


À LIRE AUSSI :

À LIRE AUSSI :

Dans l'actualité