ChannelScope

Huawei pose les fondations de l’ère intelligente de l’IA

Par Vincent Verhaeghe, publié le 27 mai 2026

business

La promesse de l’IA agentique s’accompagne pour les entreprises d’une facture invisible : un volume de données qui explose et un caractère imprévisible des charges qui met les architectures historiques en difficulté. À l’IDI Forum de Paris, le constructeur chinois a posé son diagnostic et présenté la pile sur laquelle il fonde sa réponse.

L’investissement des entreprises dans l’IA passerait d’environ 16 milliards de dollars en 2023 à près de 90 milliards en 2029, selon les projections partagées par Andrew Buss, Senior Research Director d’IDC lors de sa présentation en ouverture de l’IDI Forum organisé par Huawei à Paris. Multipliée par cinq en six ans pour la seule part entreprise, cette dynamique entraînerait dans son sillage 1 000 milliards de dollars d’investissements en équipements et data centers. Andrew Buss situe le mouvement dans une quatrième ère informatique, après le mainframe, le client-serveur et le cloud, celle de l’IA générative puis agentique.

Le glissement décisif ne tient pas au seul volume. Il tient à la nature même des charges. La première vague d’IA générative reposait sur le couple prompt-réponse, l’utilisateur conservant la main sur l’action à entreprendre. L’IA agentique fonctionne sur un modèle « reasoning and action » : des systèmes autonomes qui décident, exécutent des séquences longues et entretiennent un contexte. « Dans un avenir proche, une personne accompagnée de plusieurs agents pourra constituer une entreprise », projette Yuan Yuan, President of Data Storage Product Line de Huawei. Il s’appuie pour le dire sur les chiffres d’IDC : 30 millions d’agents actifs dans le monde aujourd’hui, et 2,2 milliards d’ici cinq ans.

La nouvelle physique des workloads

Cette nouveau paradigme change tout pour les équipes infrastructure. Les charges deviennent éphémères et leur scalabilité imprévisible. Les méthodes classiques de capacity planning n’y résistent plus. « Avant, les équipes IT avaient une certaine notion de la prédictabilité des workloads. On savait, au bout de cinq ans, qu’on aurait X pourcents de performance possible, telle capacité. Tout ça, ça part à la poubelle à cause de l’IA », résume Benoît Fix, CTO of France Data center Solution de Huawei. Le déploiement d’une application reposant sur un service cloud d’IA générative ne prend plus que quelques minutes, et les directions métiers en profitent souvent pour mettre en production sans en référer aux équipes infrastructure.

La dérive se retrouve sur le modèle économique du stockage. Le flash, jusqu’ici dominant, se heurte au coût par giga. Les clients réclament des architectures hybrides pour amortir, sans pour autant accepter le retour des contraintes mécaniques du disque dur. Andrew Buss insiste sur un point : la plupart des organisations restent peu stratégiques dans leurs achats d’infrastructure pour l’IA, déployant par à-coups des poches isolées qui peinent à se consolider à l’échelle. Le résultat n’est pas neutre. IDC chiffre à 15 % la perte de productivité que subiront en 2026 les entreprises qui ne disposeront pas de données prêtes pour l’IA.

La résilience prend le pas sur la fiabilité

Le discours dominant chez les DSI bouge en conséquence. Pendant des années, l’objectif premier d’une infrastructure de données s’exprimait en niveau de fiabilité : disponibilité, RPO, RTO, performances soutenues. Le curseur se déplace. « La résilience est désormais la seule chose sur laquelle on peut s’engager. C’est plus important que la haute fiabilité », plaide Benoît Fix lors de sa keynote. « Ce qu’on doit planifier désormais, c’est le pire scénario », en visant une garantie de 100 % de récupérabilité des données.

Concrètement, la résilience selon Huawei combine plusieurs ingrédients. Il s’agit d’abord de passer d’un gros bloc de données à isoler en cas d’incident à des petits blocs distribués, pour éviter le blocage d’un volume entier. Il faut ensuite maintenir des performances stables y compris en cas de défaillance composant, contrôleur ou site, dans un univers où la qualité de service classique ne tient plus face à l’imprévisibilité des workloads IA. Reste à automatiser la détection et la remédiation. Benoît Fix résume sa méthode d’exploitation par la méthode « 0.1.3.5 », ces chiffres désignant les temps de réaction par étape : détection proactive en amont, une minute pour identifier un problème de premier niveau, trois minutes pour qualifier une panne sur le réseau, la machine virtuelle ou le stockage, cinq minutes pour analyser les workloads concernés.

La sauvegarde, dernier rempart

L’autre déplacement notable concerne la sauvegarde. Longtemps reléguée au rang de brique secondaire, elle remonte sur le devant de la scène à mesure que les attaques par rançongiciel s’enrichissent et que la criticité des données augmente. La nouvelle génération OceanProtect, déclinée dans les baies X8100 et X9100, revendique des taux de compression jusqu’à 40 % inférieurs à ceux des leaders du marché, grâce à une carte de compression maison et à des algorithmes spécialisés par type de données. Le dispositif se double d’une protection multicouche contre les rançongiciels : sauvegarde de base, analyse IA des données stockées, puis réplication vers une « clean room » isolée pour vérifier qu’une copie est saine avant de la remettre en production sur un autre site.

L’argumentaire ne tient que parce que les attaquants utilisent eux aussi l’IA. Yuan Yuan le rappelle de façon directe : « un hacker peut désormais analyser une infrastructure cible, identifier ses vulnérabilités spécifiques et générer le code malveillant adapté en quelques minutes« . À cela s’ajoute le risque d’empoisonnement des modèles, et les tentatives de manipulation des données qui servent à entraîner ou à orchestrer les agents. La défense doit s’organiser couche par couche, depuis le data lake jusqu’aux agents.

Quand huawei recommande la stack on-premise

« Si vous prenez l’IA au sérieux dans votre entreprise, construisez votre stack en local, pour préserver vos données confidentielles et respecter vos réglementations. Vous ne pouvez pas vous contenter des services publics de Gemini ou d’OpenAI. Vous avez besoin d’une stack privée », plaide Yuan Yuan. Un discours corroboré par Andrew Buss d’IDC qui observe une demande forte d’infrastructures d’IA privées pour conserver à l’intérieur d’un périmètre maîtrisé la propriété intellectuelle, les informations salariés et les données clients sensibles.

La pile que décrit Yuan Yuan s’organise en cinq couches. À la base se trouve le data lake, qui consolide l’ensemble des données de l’organisation pour servir la chaîne d’inférence et d’agents. Vient ensuite la plateforme de données, qui orchestre la base de connaissances, la mémoire et le cache d’inférence des modèles. Au-dessus, la couche computing prend en charge l’inférence, qui devient le centre de gravité à mesure que l’IA descend dans les workflows métier. La quatrième couche héberge les modèles eux-mêmes, qu’il faut entraîner, raffiner, évaluer et aligner sur les régulations locales. Au sommet enfin, le framework d’agents fournit les briques de développement, d’auto-évolution et d’exécution sécurisée.

Le data lake à l’épreuve des cas concrets

Pour illustrer la pertinence d’un data lake centralisé, Yuan Yuan multiplie les exemples. Dans la santé, un grand hôpital chinois a ramené de 40 minutes à 15 secondes le temps de production d’un rapport de pathologie sur lame, en mobilisant seize cartes GPU et un modèle entraîné sur 300 ouvrages médicaux et un million de dossiers patients. Mieux, le modèle peut être répliqué sur d’autres hôpitaux, augmentant le niveau moyen de soin à l’échelle nationale.

Dans l’automobile, la conception d’un véhicule autonome de niveau 5 impose de gérer plus de 100 pétaoctets de données issues des capteurs, des radars et des conditions météorologiques. L’exigence est double : capacité brute, mais aussi visibilité globale entre data centers et accès sémantique rapide à des séquences rares. « Combien d’images d’un chien traversant un feu rouge sous la pluie avez-vous dans votre base, et en combien de secondes pouvez-vous les retrouver pour entraîner vos modèles ? », interpelle Yuan Yuan.

Etant donné les coûts des équipements, la mutualisation des équipements prend ici tout son sens. La virtualisation du GPU prend ici tout son sens : une carte B200 facturée 100 000 euros n’a pas vocation à être monopolisée par un modèle qui n’en utilise qu’une fraction.

La pile produit Huawei

Pour répondre à ces volumes et à cette diversité d’usage, Huawei aligne ses briques. Sur la couche data lake, OceanStor Pacific revendique une densité énergétique de 25 watts par téraoctet et un moteur de recherche sémantique capable de croiser image, son et texte. Sur la couche stockage primaire, la nouvelle génération Dorado introduit des cartes DPU développées en interne par Huawei pour séparer le plan de données du plan de contrôle. Concrètement, lorsqu’une requête arrive sur la baie, les métadonnées passent par le CPU pendant que la donnée circule en direct depuis le point d’accès jusqu’aux disques. Le goulot d’étranglement n’est plus le disque mais le CPU des baies, et la carte DPU vise précisément ce point de saturation.

Côté virtualisation, Huawei pousse DCS, héritage de l’offre HTS déployée depuis plusieurs années dans des grands comptes français. L’argumentaire commercial s’aligne très précisément sur ceux qui ne souhaitent pas poursuivre avec VMware depuis le rachat par Broadcom. « On est en licence perpétuelle, il n’y a donc aucune surprise. Pour l’hyperviseur, la licence est rattachée au socket physique », énumère Benoît Fix. L’interface a été retravaillée pour limiter la rupture d’expérience par rapport à VMware. Les clients français restent toutefois prudents. L’argument tarifaire reste décisif dans des organisations malmenées par l’inflation des licences cloud et hyperviseur…

Sur la sauvegarde, le positionnement Huawei est revendiqué comme l’anti-modèle des éditeurs passés au tout-abonnement. « On a notre logiciel de sauvegarde qui s’intègre dans l’appliance directement. Le mode de licensing, c’est simple : il n’y en a pas vraiment. On achète la machine avec ou sans soft, et c’est tout », indique Benoît Fix. Aucune limite par machine virtuelle, par agent ni par capacité au-delà de la capacité physique de l’appliance. Un contrat de support reste nécessaire pour bénéficier des mises à jour, mais la licence elle-même est perpétuelle.

Auchan, le passage à l’acte

Le témoignage du groupe Auchan a illustré sur scène ce que ce discours produit lorsqu’il rencontre une réalité industrielle. L’enseigne, fondée en 1961, présente dans douze pays avec environ 3 000 magasins, 32 milliards d’euros de chiffre d’affaires et près de 160 000 collaborateurs, entretenait quatre fois plus d’applications que ses concurrents, deux fois plus de fournisseurs, et un TCO supérieur de 100 % à ce qui était attendu. Son CTO, Pierre-François Rudent a détaillé le projet de migration mené depuis septembre dernier : bascule du data center historique de Lyon, sous VMware, vers une architecture Huawei DCS distribuée sur trois data centers. Deux sites en région lyonnaise sont gérés en haute disponibilité au sein d’un même data center virtuel ; le troisième assure la reprise d’activité.

Au-delà de la simplification de l’architecture, le retour sur investissement repose sur une division par deux du TCO sur cinq ans face à la solution précédente. Le groupe exploite désormais plus de 5 000 machines virtuelles sur cette infrastructure, avec un taux de réussite de la migration des VM de l’ordre de 99 % dès le premier passage. Les magasins ont continué à fonctionner pendant la bascule, condition non négociable pour un retailer ouvert au public.

À LIRE AUSSI :