Selon Nvidia, L’IA agentique redonne au CPU un rôle stratégique

Newtech

Computex 2026 : Nvidia redécouvre les vertus du CPU

Par Laurent Delattre, publié le 03 juin 2026

Signe des temps, Nvidia est venu à Computex parler moins de GPU que de CPU. Bien sûr, les accélérateurs Blackwell, Rubin et les technologies RTX restent au cœur du récit de la firme américaine. Mais le message porté à Taipei par Jensen Huang était ailleurs : à l’ère des agents IA, le GPU ne suffit plus. L’IA agentique ne se contente pas de générer des tokens. Elle planifie, appelle des outils, exécute du code, consulte des bases, manipule des fichiers, orchestre des processus. Et tout cela remet le CPU au centre du jeu. Un jeu que Nvidia ne veut pas laisser les autres mener seuls.

« Les agents IA seront les plus gros consommateurs de puissance de calcul », a martelé Jensen Huang en ouverture de sa keynote. Avant d’ajouter : « Vera est le premier processeur conçu pour cet avenir, pensé pour exécuter l’IA agentique à très grande échelle, avec des performances, une efficacité et une programmabilité hors normes. »

Le ton est donné. Nvidia n’est pas venu à Computex parler de GPU, mais de CPU. Et notamment de son CPU « VERA » déjà largement évoqué à la GTC 2026 en mars dernier.

Nvidia le présente comme son premier CPU pensé spécifiquement pour les agents IA. Le processeur repose sur des cœurs maison Olympus, avec 88 cœurs, du Spatial Multithreading et une mémoire LPDDR5X capable d’atteindre 1,2 To/s de bande passante. Selon Nvidia, Vera permet d’exécuter les tâches agentiques 1,8 fois plus vite que des CPU x86 comparables.

Dans une usine IA moderne, les GPU ne calculent plus seuls. Ils attendent que les CPU orchestrent les environnements d’exécution, lancent les scripts Python, compilent du code, interrogent des bases SQL, gèrent les sandboxes, préparent les données et coordonnent les appels d’outils. Autrement dit, plus les agents deviennent autonomes, plus le CPU devient un point de contention.

« L’IA agentique est un nouveau type de charge de travail. Une seule requête peut lancer un parcours en mille étapes mêlant raisonnement, récupération d’information, usage d’outils et génération de réponse » décrypte Jensen Huang. Avant d’ajouter, « Vera Rubin a été conçu pour ce moment : un moteur d’usine d’IA capable de fournir de l’intelligence à grande échelle, avec les performances, l’efficacité et la sécurité nécessaires pour alimenter la prochaine révolution industrielle. »

Cette focalisation du discours sur le CPU traduit en réalité une prise de conscience de NVidia. La firme a toujours vu plus loin que le hardware, plus loin que le GPU. Elle s’est emparée de toute l’infrastructure de l’IA, du hardware jusqu’aux applications IA en passant par les frameworks, les middlewares, les runtimes, les bibliothèques, les outils d’orchestration, les modèles IA, les plateformes d’exécution, etc. « NVIDIA est véritablement devenu une entreprise d’infrastructure. Pas seulement une entreprise de GPU. Pas seulement une entreprise de systèmes » a ainsi rappelé Jensen Huang en ouverture.

Et Nvidia a de grandes ambitions sur les CPU… À la hauteur de celles pour les GPU. Avec la même volonté : celle de couvrir les besoins du PC au Cloud en passant par les datacenters d’entreprise.

Vera sera utilisé dans trois familles de systèmes : les serveurs CPU autonomes, les plateformes Vera Rubin et les architectures de stockage Vera BlueField-4 STX.

Nvidia revendique déjà l’intérêt d’acteurs comme Anthropic, OpenAI, SpaceXAI, ByteDance, CoreWeave, Oracle Cloud Infrastructure, Cloudflare, Lambda, Nebius ou encore Nscale. Côté constructeurs, Dell, HPE, Lenovo, Supermicro, ASUS, Foxconn, Gigabyte, QCT, Wistron et Wiwynn font partie de l’écosystème annoncé.

Vera Rubin : l’usine IA devient un système complet

Le CPU Vera n’arrive pas seul. Il devient l’un des piliers de Vera Rubin, la prochaine grande plateforme IA de Nvidia. Là encore, l’approche n’est plus de vendre une puce, mais une architecture complète : CPU, GPU, réseau, stockage, sécurité, refroidissement, logiciel d’exploitation et jumeau numérique d’infrastructure.

Avec Vera Rubin, Nvidia veut imposer une nouvelle métrique : non plus les FLOPS, mais le coût du token. L’économie de l’IA ne se mesure plus seulement à la puissance brute, mais au nombre de tokens produits par watt, par dollar et par mètre carré de datacenter. D’où l’insistance de Jensen Huang sur les « AI factories », ces usines à intelligence qui doivent être conçues comme des sites industriels complets, et non comme de simples salles serveurs.

C’est dans cette logique que Nvidia pousse DSX, sa plateforme de référence pour concevoir, construire et exploiter des usines IA. DSX regroupe les briques matérielles, les logiciels d’orchestration, les outils de supervision et les partenaires industriels nécessaires à la mise en production rapide de datacenters IA. Nvidia y ajoute DSX MaxLPS, destiné à maximiser la performance en tokens par mégawatt, et DSX OS, un socle logiciel modulaire et open source pour la gestion du cycle de vie, la résilience, la cohérence runtime et les opérations multi-tenant.

BlueField-4 STX : sécuriser la mémoire des agents

Dans l’IA agentique, les données ne sont plus simplement consultées. Elles sont lues, modifiées, indexées, résumées, réutilisées par des agents qui agissent sans supervision humaine permanente. Nvidia en tire une conséquence directe : le stockage devient un point de contrôle de sécurité.

Vera BlueField-4 STX combine Vera, ConnectX-9, Spectrum-X, DOCA et des fonctions de sécurité en silicium pour créer une architecture de stockage pensée pour les agents IA. Nvidia annonce de nouvelles capacités DOCA Vault, DOCA Argus et DOCA Flow pour contrôler l’accès aux fichiers, observer le comportement des agents et isoler les flux réseau. « L’IA agentique transforme les données de l’entreprise en un système vivant, en temps rée et ce système doit être protégé là où les données circulent, là où le contexte est stocké et là où les agents agissent. », résume Jensen Huang.

Selon Nvidia, cette approche permettrait une détection runtime jusqu’à 1 000 fois plus rapide que les solutions agentless classiques, avec une application des politiques réseau et fichiers jusqu’à 800 Gb/s. Les plateformes STX sont attendues chez les partenaires au second semestre 2026, avec un écosystème comprenant notamment Dell, HPE, IBM, NetApp, Nutanix, VAST Data, WEKA, DDN, MinIO, Supermicro, QCT, Foxconn et Wistron.

RTX Spark : Nvidia veut réinventer le PC

Nous en avons déjà longuement parlé hier. Dans la logique évoquée plus haut, Nvidia est aussi venu à Computex pour parler de PC et de superpuces pour Windows : RTX Spark.
Avec cette nouvelle plateforme pour PC Windows (qui semble dériver des travaux réalisés avec le GB10 qui animait la mini station « DGX Spark » lancée en mars 2025), Nvidia ne se contente plus d’être le fournisseur du GPU. Il marche directement sur les platebandes d’Intel, AMD, Qualcomm et Apple Silicon en fournissant un superchip complet associant un GPU Blackwell RTX à 6 144 cœurs CUDA et un CPU Grace à 20 cœurs (co-conçu avec Mediatek), reliés par la technologie NVLink-C2C. Le tout peut embarquer jusqu’à 128 Go de mémoire unifiée et délivrer jusqu’à 1 pétaflop de calcul IA.

Objectif : inaugurer une nouvelle ère du PC en partenariat avec Microsoft. L’objectif n’est pas seulement de faire tourner des jeux ou des outils créatifs plus vite. Il s’agit de transformer le PC Windows en machine locale pour agents IA personnels. Nvidia parle d’un ordinateur qui passe du statut d’outil à celui de « teammate », autrement dit un compagnon de travail capable d’exécuter des tâches localement.
Nvidia et Microsoft promettent aussi une plateforme Windows sécurisée pour les agents locaux, avec OpenShell et de nouveaux mécanismes de sécurité au niveau de l’OS.
Les deux acteurs ont d’ailleurs annoncé la déclinaison sous Windows de la Workstation « DGX Station » imaginée par NVidia et disponible depuis la fin 2025, qui jusqu’ici, fonctionnait sous Linux. Celle-ci est basée sur un processeur « GB300 Desktop »

Pour NVidia, l’essentiel est de s’assurer que du poste du développeur à celui de l’utilisateur, du Edge au Cloud, du PC aux datacenters, ses briques (CUDA, OpenShell, TensorRT, Triton, NIM, NeMo, Nemotron, NemoClaw, Omniverse, Cosmos, Isaac, DGX Cloud) restent la plateforme de prédilection de l’IA partout où celle-ci est hébergée, inférée, entraînée, utilisée. Nvidia veut être le CPU des agents, le GPU des modèles, le DPU du réseau, le moteur du stockage, le jumeau numérique du datacenter, la boîte à outils du développeur, le runtime sécurisé de l’agent local et la plateforme de simulation du robot.

Pour en savoir plus, reportez-vous à notre analyse : Avec Spark RTX, Nvidia veut mettre le PC à l’heure des agents IA

Une stratégie qui s’appuie sur une roadmap 2030

Certains s’étonneront peut-être de voir des technologies comme « Grace » et « Blackwell » associées au RTX Spark. Mais Nvidia ne cherche pas à écouler de l’ancien. Mais rembourse ses investissements sur les datacenters avec le meilleur de sa technologie tout en rendant la génération précédente accessible à tous. Et le fondeur a de la vision. Les prochaines générations sont déjà en chantier. « Spark » sera décliné en génération Vera Rubin en 2028 pendant que les datacenters inaugureront la génération « Rosa Feynman » qui sera, elle, déclinée en « Spark » en 2030.

Au final, ce Computex aura marqué une bascule stratégique. Pendant des années, Nvidia a expliqué que le GPU était le moteur de l’IA. Jensen Huang a envoyé cette semaine un message plus large : l’IA agentique a besoin d’une informatique complète. Et dans cette nouvelle informatique, le CPU redevient central, non pas contre le GPU, mais pour l’empêcher d’attendre.

Reste qu’au final, ce message est aussi une déclaration de guerre à tout l’écosystème historique du calcul généraliste. Intel, AMD, Qualcomm, les fabricants de serveurs, les fournisseurs de stockage, les éditeurs d’outils de développement, les plateformes cloud et les industriels de la robotique sont prévenus : Nvidia entend architecturer à sa façon l’usine IA entière…


Cosmos 3, Alpamayo 2, GR00T : cap sur l’IA physique

Computex 2026 a également été l’occasion pour Nvidia d’appuyer son discours sur l’IA physique. Cosmos 3 est présenté comme un modèle ouvert de monde destiné à aider les robots, véhicules autonomes et systèmes physiques à raisonner avant d’agir. Axios rapporte que Cosmos 3 a été entraîné sur 20 000 milliards de tokens multimodaux, incluant près d’un milliard d’images, 400 millions de vidéos réelles et synthétiques, de l’audio ambiant, du texte et des données d’action.

Nvidia a aussi mis en avant Alpamayo 2 Super pour les robotaxis, DRIVE Hyperion pour les plateformes autonomes et Isaac GR00T Reference Humanoid Robot, un design de référence ouvert pour la recherche académique sur les humanoïdes. L’enjeu est clair : après l’IA générative et l’IA agentique, Nvidia prépare le terrain de l’IA incarnée, celle qui perçoit, simule, décide et agit dans le monde réel.


Un marché PC en pleine interrogation

L’arrivée de Nvidia sur le marché PC Windows avec sa plateforme RTX Spark nous promet une nouvelle ère du PC. Pour les DSI, elle promet un peu plus de chaos.
En pleine crise de pénurie mémoire qui fait enfler les prix, le marché PC est tiraillé par de multiples tendances.

* Celle du premium d’abord : parce que c’est là que les marges se font quand la quantité ne peut être délivrée. Un marché du Premium lui-même tiraillé par trois tendances : la lutte x86/Intel-AMD versus ARM/Qualcomm, les Copilot+ PC (avec leur NPU dont l’utilité reste toujours à démontrer), et désormais les « RTX Spark » qui promettent un PC Agentique.

* L’arrivée des Android PC, ou plus exactement des GoogleBooks qui s’attaquent également au segment premium et promettent également un PC Agentique animé par Gemini. La question est de savoir si Nvidia sera ou non partenaire des GoogleBooks (alors que Qualcomm est le seul actuellement officialisé).

* Celle de l’entrée de gamme initiée par le Macbook Neo d’Apple. La machine a redéfini le visage de l’entrée de gamme. Le marché PC cherche une réponse. Mais ne sait pas trop où la trouver. D’un côté, Intel a lancé sa famille « Core Series 3 » connue sous le nom de « Wildcat Lake » et qui permet typiquement à Dell de lancer un XPS 13 à 699 dollars. De l’autre, Qualcomm qui a lancé son « Snapdragon C » construit sur ses anciennes technologies Smartphone. Des machines qui ne sont pas des foudres de guerre mais pourraient être proposées dès 300$. Des machines qui sont surtout limitées par 8 Go de RAM dont Windows 11 a bien du mal à se satisfaire. Et qui font forcément peur aux DSI qui se souviennent de la vague Netbooks en 2007 : des machines ultrabridées, avec des écrans minuscules, offrant une expérience médiocre, et qui sont devenues obsolètes quelques mois après leur sortie.

Tout ceci ne contribue pas à rendre le marché PC plus lisible et dynamique. Bien au contraire, il n’a jamais été aussi complexe. De quoi intensifier une morosité annoncée


À LIRE AUSSI :

À LIRE AUSSI :

À LIRE AUSSI :

Dans l'actualité

Verified by MonsterInsights