Guerre des IA - Anthropic dicte sa Loi aux hyperscalers à commencer par Microsoft et Amazon

Data / IA

Hyperscalers & guerre des IA : Anthropic courtisé d’un côté, contesté de l’autre

Par Laurent Delattre, publié le 30 juin 2026

Les géants du cloud pensaient tenir les clés de l’IA. Ils découvrent aujourd’hui que les éditeurs des modèles peuvent aussi leur dicter leurs conditions alors que ces derniers cherchent à s’aventurer à Wall Street et sont largement prisés par les entreprises clientes. Entre Azure, AWS, Claude et OpenAI, la guerre des IA change de centre de gravité. Mais la facture devrait elle continuer de grimper…

À quelques heures d’intervalle, et deux informations parallèles, Anthropic a offert l’illustration des deux extrémités d’un même paradoxe. Microsoft vient de généraliser l’accès à Claude sur sa propre infrastructure Azure, propulsée par les systèmes GB300 de Nvidia.
Au même moment, Amazon – premier bailleur de fonds de la jeune pousse – étudierait un repli vers les modèles d’OpenAI et sa famille de modèles maison Nova, changement tarifaire d’Anthropic oblige.
Deux annonces qui racontent l’histoire d’un rapport de force qui se déplace.
Le centre de gravité s’est déplacé des hyperscalers « qui possèdent le client » vers les laboratoires d’IA « qui possèdent les modèles ».

Deux mouvements en miroir

Côté Microsoft, les modèles Claude sont désormais disponibles en disponibilité générale dans Microsoft Foundry, exécutés de bout en bout sur l’infrastructure Azure et accélérés par les GPU GB300 Blackwell Ultra de Nvidia, reliés par le réseau InfiniBand Quantum-X800 pensé pour les systèmes agentiques et leurs sous-agents spécialisés.
Onze modèles Anthropic figurent désormais dans Foundry, d’Opus 4.8 à Sonnet 4.6, en passant par les références Mythos et Fable pourtant frappées de restrictions, facturés en Claude Consumption Units (CCU) via la place de marché Azure, avec la possibilité d’imputer la dépense sur l’engagement de consommation Azure déjà négocié par l’entreprise.
Surtout, Microsoft distingue désormais deux modes : « hébergé sur Azure » et « hébergé sur l’infrastructure d’Anthropic », une nuance loin d’être anecdotique pour les organisations soumises à des exigences d’approvisionnement, de conformité ou de traitement des données.

Le socle matériel donne la mesure de l’enjeu : un rack GB300 NVL72, entièrement refroidi par liquide, agrège 72 GPU Blackwell Ultra et 36 processeurs Grace, 37 To de mémoire rapide, 130 To/s de bande passante NVLink et jusqu’à 1 440 pétaflops en FP4. L’ensemble s’inscrit dans un accord tripartite Microsoft–Nvidia–Anthropic : Anthropic s’est engagé à acheter pour 30 milliards de dollars de capacité Azure et à contractualiser jusqu’à un gigawatt supplémentaire, quand Nvidia et Microsoft promettent d’investir respectivement jusqu’à 10 et 5 milliards dans le laboratoire.

Côté Amazon, le ton est tout autre. Selon The Information, le contrat liant les deux partenaires, renégocié en début d’année, basculera l’an prochain d’une facturation à l’heure de calcul vers une facturation au jeton, susceptible d’alourdir la facture. Même si Amazon conteste cette augmentation potentielle, la firme en revanche ne nie pas chercher désormais des solutions de rechange pour certains de ces services. Notamment en adoptant plus largement les modèles d’OpenAI, désormais disponibles sur Bedrock aux côtés de l’agent Codex, et sa propre famille de modèles « Nova », lancée fin 2024 et positionnée sur le coût et la latence.
Le paradoxe est saisissant : Amazon n’est pas un simple client d’Anthropic, mais l’un de ses tout premiers investisseurs – avec 8 milliards déjà engagés, 5 milliards annoncés en avril, jusqu’à 20 milliards supplémentaires conditionnés à des jalons commerciaux -, Anthropic ayant de son côté promis plus de 100 milliards de dépenses sur dix ans en technologies AWS, puces Trainium comprises. Mais une nouvelle danse, un nouveau rapport de force, se dessine désormais entre les deux partenaires.

Le client n’est plus roi : le modèle reprend la main

Ces deux trajectoires, en apparence contradictoires, obéissent à la même logique. La vague d’investissements de 2023 (Amazon, Google et Microsoft se disputant l’accès aux laboratoires) reposait sur un pari implicite : la capacité des modèles serait abondante, et le pouvoir resterait du côté de ceux qui maîtrisent la distribution et la relation client.

La capacité d’Anthropic à relever aujourd’hui les tarifs imposés à Amazon signe la rupture de ce postulat. Devenu une brique d’infrastructure critique, au point qu’Amazon adosse à Claude son agent de programmation Kiro, son assistant Quick et son outil Alexa for Shopping, le modèle a pris l’ascendant sur le distributeur. La dépendance d’Anthropic aux puces Trainium et au cloud AWS, qu’Amazon pensait pouvoir transformer en levier de négociation, s’est révélée un verrou plus fragile que prévu.

Autrement dit, l’accès aux modèles de pointe n’est plus un marché où l’acheteur impose ses conditions. Avoir investi tôt dans un laboratoire permettait de verrouiller des tarifs avantageux. Mais à mesure que ces contrats arrivent à renégociation, même les premiers bailleurs de fonds, Amazon en tête, se voient appliquer le prix du marché, que les nouveaux venus, eux, paient d’emblée. Et comme ces modèles servent de socle à une multitude de produits, des outils de développement aux assistants métier, toute hausse à la source se diffuse mécaniquement à l’ensemble des services qui en dépendent. Et Anthropic a désormais les épaules pour imposer ses volontés aux hyperscalers.

La facturation au jeton, nouveau nerf de la guerre

Derrière ce bras de fer se joue une question qui concerne directement les DSI : celle du modèle économique de l’IA générative. Pendant deux ans, les éditeurs ont subventionné l’usage pour conquérir des parts de marché. Cette époque se referme. La facturation au token s’impose désormais jusque dans les assistants de développement et les marketplaces cloud. Conséquence, la note grimpe avec l’intensité d’usage, et l’essor des charges agentiques, qui dévorent les jetons à un rythme inédit..

Le vocabulaire de facturation traduit ce glissement. Dans certaines places de marché, notamment Foundry et Claude Platform on AWS, la facturation passe par des CCU (Claude Consumption Units ), l’usage restant converti depuis les tokens (cent CCU équivalent à un dollar de consommation).

Pour le DSI, la conséquence est double. La dépense devient difficilement prévisible, un même agent peut consommer des volumes très variables selon la formulation des requêtes, et le pilotage financier du cloud doit désormais intégrer le coût des modèles au même titre que celui du calcul ou du stockage. La maîtrise des coûts d’inférence s’impose comme une compétence à part entière.

Le vertige du financement circulaire

Le second débat, plus structurel, porte sur la soutenabilité de l’édifice. Les annonces de Microsoft et d’Amazon mettent en lumière la circularité croissante des financements de l’IA. Nvidia investit jusqu’à 10 milliards dans Anthropic, qui lui achète en retour des GB300 par l’entremise d’Azure. Microsoft injecte jusqu’à 5 milliards et se fait promettre 30 milliards de consommation Azure. Amazon a engagé plusieurs milliards et obtenu un engagement de dépense supérieur à 100 milliards sur AWS. Les mêmes acteurs sont à la fois actionnaires, fournisseurs d’infrastructure, revendeurs des modèles et clients, un entrelacement qui gonfle les carnets de commandes mais brouille la lecture de la valeur réellement créée.

Cette architecture nourrit la fameuse crainte d’une bulle : tant que les capitaux investis reviennent sous forme de commandes de calcul, les chiffres d’affaires affichés peuvent croître sans qu’une demande finale solvable les valide à proportion. La renégociation imposée par Anthropic à Amazon est, à cet égard, un signal de maturité autant que de tension : le laboratoire cherche à convertir des engagements croisés en revenus tangibles, et en fait porter l’effort sur ses partenaires-distributeurs.

Pour les DSI : le multi-modèle comme police d’assurance

Que retenir, côté entreprise, de cette partie d’échecs entre géants ? D’abord, que la dépendance à un fournisseur unique de modèles constitue un risque comparable à la dépendance à un fournisseur unique de cloud.
Les plateformes l’ont d’ailleurs anticipé : Bedrock juxtapose désormais Claude, Nova et les modèles d’OpenAI ; Foundry héberge Claude aux côtés des modèles maison de Microsoft et d’OpenAI. Cette logique de couche d’abstraction, qui permet de servir un client souhaitant une alternative à Claude sans lui faire quitter le cloud, répond directement au risque de verrouillage et invite les DSI à concevoir leurs applications de manière à pouvoir changer de modèle sans tout réécrire.

Ensuite, elle nous rappelle que la gouvernance se joue dans les détails. La distinction introduite par Microsoft entre exécution « sur Azure » et « sur l’infrastructure d’Anthropic » n’est pas cosmétique : elle conditionne la localisation des traitements, les engagements de conformité et la chaîne de responsabilité. Pour les organisations européennes, elle prolonge un débat familier, celui de la souveraineté numérique, d’autant que l’épisode des modèles Fable et Mythos, dont l’accès a été suspendu par une directive du gouvernement américain, ou encore GPT-5.6 à l’accès ultra filtré, rappelle que l’accès aux capacités de pointe peut, du jour au lendemain, relever d’une décision réglementaire extérieure. Bâtir sa stratégie d’IA sur un modèle propriétaire américain, c’est accepter une part d’exposition à des arbitrages géopolitiques sur lesquels l’entreprise n’a aucune prise.

Tout ceci invite forcément les DSI à regarder de plus près les modèles ouverts ou open-weight, notamment ceux de Mistral, et de certains éditeurs chinois. Mais cela invite aussi de plus en plus les DSI à réfléchir aux possibilités d’inférence en local directement dans leurs datacenters et même directement sur les machines des développeurs et pourquoi pas des utilisateurs. Le chemin est encore long, mais l’inflation des coûts de l’IA ne fait qu’accélérer ces nouveaux parcours.

Diversifier les fournisseurs, instrumenter le coût des jetons, accélérer l’adoption des modèles ouverts et de leur exécution locale, traiter la portabilité des modèles non comme un confort, mais comme une assurance… Voici les nouveaux défis qui s’inscrivent dans l’agenda des DSI en cette seconde moitié d’année 2026.

À LIRE AUSSI :