Newtech
Build 2026 (2/2) : Comment Microsoft assemble sa plateforme pour agents d’entreprise
Par Laurent Delattre, publié le 05 juin 2026
À Build 2026, Microsoft a sorti le grand jeu agentique : mémoire contextuelle Microsoft IQ, modèles MAI maison, agents autonomes, backend managé Rayfin, poste de pilotage développeur et gouvernance multicloud Agent 365. La promesse est simple : réduire la corvée d’intégration. l’éditeur assemble une pile cohérente, mais dont la puissance renforce aussi l’attraction vers son propre écosystème.
Deux mots clés auront éclairé cette édition 2026 de la conférence développeurs Microsoft Build. D’abord « Windows », et c’est un peu une surprise comme nous l’expliquons dans la première partie de notre compte-rendu (Build 2026 : Windows is Back, Baby !).
Ensuite « IA agentique », et c’est là beaucoup moins une surprise puisque c’est le thème central de toute conférence IT depuis bientôt un an.
Deux mots pour les deux pendants d’une ère d’agents IA amenés à s’exécuter à l’Edge (avec un Windows repensé en moteur d’exécution locale de l’IA agentique) comme dans le Cloud et les datacenters, autre versant de l’offensive agentique de Microsoft à l’occasion de cette Build 2026.
La première partie racontait l’histoire du retour en grâce d’un système au service d’une « unmetered intelligence » (une intelligence sans monnayeur) qui s’installe à la périphérie avec des SLM Aion embarqués, des machines Surface RTX Spark pour développeurs et explorateurs du potentiel, et, surtout, la promesse de boucles agentiques entièrement locales.
Mais ce spectaculaire come-back du poste de travail n’est que l’étage visible d’un édifice beaucoup plus vaste que l’on vous présente dans cette seconde partie.
L’IA Agentique, « ce n’est pas une question de technologie isolée, ni même de plateforme ; c’est la valeur que vous pouvez bâtir, composer et créer par-dessus la plateforme » explique Satya Nadella en ouverture de la Build. Et toute sa demonstration, tout cette conférence 2026, se lit à travers une pile à six étages que le CEO a déroulé méthodiquement : le tissu de calcul (edge + cloud), la couche modèles/contexte/outils, le runtime des agents, l’outillage, et – transversalement – la sécurité, la conformité et la gouvernance. La première partie couvrait le socle. Cette seconde remonte tout le reste, là où se joue, à notre sens, la vraie bataille concurrentielle : non pas le modèle le plus puissant, mais l’orchestration de l’ensemble. La question fil rouge de Satya Nadella le dit sans détour : « Comment, tous, participez-vous pleinement à cet écosystème d’intelligence frontière ? »

Microsoft s’est ainsi évertuée à démonter qu’elle disposait désormais – pour les développeurs comme pour les DSI – d’une plateforme complète destinée à créer, contextualiser, gouverner, sécuriser et industrialiser les agents IA en entreprise. L’éditeur ne parle plus seulement d’assistants conversationnels Copilot. Place à l’ère des agents connectés aux données, aux workflows, aux outils métiers et aux règles de sécurité de l’organisation. Il fournit l’ensemble de la chaîne technique permettant aux entreprises de bâtir leurs propres agents : modèles, contexte, données, mémoire, développement, déploiement, supervision et sécurité. Une ambition qui s’incarne non seulement au travers des briques déjà présentées à Ignite 2025 en novembre dernier mais aussi dans un assemblage enrichi de briques baptisées Microsoft IQ, Foundry, Agent 365, Rayfin, GitHub Copilot App ou encore MAI.
Microsoft IQ, la mémoire contextuelle des agents
Le cœur de cette Build 2026 côté entreprise tient en deux lettres : IQ. Avec Microsoft IQ, l’éditeur introduit une couche de contexte destinée à ancrer les agents dans les connaissances réelles de l’entreprise, mais aussi dans les informations du web.
Le patrimoine de données des entreprises, rappelle Nadella, a été conçu pour des applications destinées à des utilisateurs ; il doit désormais être reconstruit pour des agents, dont les schémas d’accès sont radicalement différents : « Les agents stockent, récupèrent, raisonnent, agissent et apprennent en continu. » D’où le corollaire que tout DSI devrait afficher au-dessus de son bureau : « Quand on parle d’efficacité des tokens, structurer correctement le contexte et le donner aux modèles, c’est, par définition, devenir bien plus efficient. » Autrement dit, le context engineering devient un poste de coût et un facteur de performance de premier ordre et c’est précisément ce que Microsoft IQ entend industrialiser.

La pile IQ s’articule autour de quatre briques complémentaires (dont trois avaient déjà été présentées en preview à Microsoft Ignite 2025), chacune répondant à une question que se pose tout agent IA (mais aussi humain).
Foundry IQ répond à « que sais-je sur ce sujet ? ». C’est la base de connaissance ingérée par le modèle : une source unique et ancrée qui empaquette documents, données opérationnelles et personnes en un contexte sur lequel l’agent peut raisonner.
Fabric IQ répond à « comment fonctionne mon métier ? ». C’est la couche sémantique et ontologique : un modèle vivant de l’entreprise. Le coup de maître stratégique tient en une phrase entendue dans la démo : « Nous n’avons pas construit cela à partir de zéro. »
Fabric reprend les semantic models Power BI utilisés par des millions de clients et les prolonge en ontologies riches, couplées à la télémétrie en temps réel. Avec Fabric IQ, les agents raisonnent sur des entités, règles et modèles cohérents. Le tout avec une friction de migration quasi nulle et un réemploi maximisé de l’existant, voilà qui est redoutablement habile.
Work IQ répond à « comment, chez nous, traite-t-on ce cas ? ». Ce sont les procédures et les personnes, lues en direct depuis SharePoint et non pas un instantané figé. La nuance compte : « Quand la procédure change, la réponse change avec elle. Pas de ré-upload, pas de reconstruction de prompt, pas de version périmée. ». Work IQ vise à capter la manière dont le travail se déroule réellement dans Microsoft 365 : personnes, emails, documents, réunions, relations, interactions et flux d’activité. L’objectif est de fournir aux agents une compréhension de l’organisation qui dépasse largement le simple accès documentaire.
La quatrième brique, grande nouveauté de cette Build 2026 n’est autre que WEB IQ. Elle répond à « que se passe-t-il dans le monde, maintenant ? ». C’est le grounding web, bâti sur l’infrastructure qui sert déjà plus d’un milliard d’utilisateurs (comprendre l’héritage Bing), mais ré-architecturé pour le LLM et le workflow agentique. Atout réel : la brique est model-agnostic et MCP-native, donc enfichable dans n’importe quel runtime d’agent, web/actualités/images/vidéo compris. Microsoft la dit « best in class » sur les trois axes qualité, vitesse et coût, un triptyque qu’il faudra évidemment vérifier en production, car ce n’est pour l’instant qu’une revendication d’éditeur.

L’enjeu est considérable. Les agents IA n’ont de valeur que s’ils comprennent le contexte dans lequel ils agissent. Sans cette couche, ils restent des interfaces génériques branchées sur des modèles puissants mais aveugles à la réalité opérationnelle de l’entreprise. Avec Microsoft IQ, l’éditeur veut transformer ses graphes, ses données collaboratives, ses couches sémantiques et ses services de recherche en carburant natif pour l’agentique. De quoi offrir aux agents IA « une compréhension continuellement actualisée de votre organisation » selon les termes de Satya Nadella.
L’idée est fondatrice, mais l’exécution interroge encore. « IQ » reste pour l’instant surtout un parapluie marketing posé sur des briques encore très hétérogènes (un service web, une couche ontologique, un graphe M365) dont l’unification annoncée paraît encore aujourd’hui davantage conceptuelle que concrète. En outre, ce n’est pas parce que « cette connaissance est la vôtre, les actifs que vous créez restent chez vous, quel que soit le modèle qui raisonne dessus » comme l’affirme Satya Nadella que son adoption ne vient pas renforcer encore la dépendance, le lock-in. Plus vous « groundez » (ancrez) vos agents dans Microsoft Fabric et M365, plus la dépendance s’intensifie.
Autopilots et Scout : le « claw » d’entreprise
Autre annonce phare, elle aussi couverte d’une jolie couche marketing avec son côté opportuniste et révélatrice de l’air du temps, Microsoft introduit les « Autopilots », nouveau concept agentique que Nadella définit crûment comme « des claws de qualité entreprise » : « des agents autonomes, longue durée, avec une conformité entreprise complète, qui tournent dans votre tenant », dotés d’un nom, d’une personnalité, de connecteurs, de contexte et de mémoire. « Une toute nouvelle façon de réduire la corvée pour revenir à ce qu’on aime » souligne Satya Nadella.

Et le premier des Autopilots introduit par l’éditeur se prénomme « Scout », disponible pour les abonnés Copilot Frontier. Ce nouvel agent personnel de travail s’appuie sur OpenClaw et Work IQ pour accompagner les utilisateurs dans leurs tâches quotidiennes, notamment dans Teams, Outlook et les environnements Microsoft 365. Il est censé être capable de préparer des réunions, résoudre des conflits d’agenda, suivre des tâches ou exploiter le contexte professionnel de l’utilisateur.
Scout illustre une bascule importante. Microsoft ne conçoit plus seulement Copilot comme un assistant que l’on interroge, mais comme un agent qui observe, comprend et agit dans le flux de travail. Cette orientation rapproche Microsoft des autres grandes plateformes qui cherchent à imposer la figure du « collègue IA » : un agent persistant, personnalisé, connecté aux outils métier, capable de passer de la recommandation à l’action.
Et Microsoft envisage déjà une feuille de route qui promet « une équipe numérique complète d’autopilots » au service de votre quotidien.
MAI : Microsoft muscle ses propres modèles
La dernière annonce phare et structurante de cette Build 2026 concerne les modèles IA! Longtemps perçu comme très dépendant d’OpenAI pour ses modèles les plus avancés, Microsoft accélère désormais fortement le développement de ses propres briques « MAI » (Microsoft AI).
Au point désormais de s’afficher en concurrent ultra crédible d’OpenAI, de Google et d’Anthropic. À Build 2026, l’éditeur a annoncé sept nouveaux modèles maison couvrant le raisonnement, le code, l’image, la transcription et la voix. Des annonces qui montrent qu’il va désormais falloir compter sur Microsoft pour tout ce qui touche aux modèles frontières !

Le plus symbolique est MAI-Thinking-1, premier modèle de raisonnement de Microsoft AI. Il vise notamment les tâches complexes, les mathématiques et le développement logiciel. Il s’appuie sur une architecture MoE à 35 milliards de paramètres actifs, dispose d’une fenêtre de 256 000 tokens et obtient 97 % au bench AIME 2025 et un score de 53 % sur SWE-Bench Pro.
À ses côtés, MAI-Code-1-Flash (seulement 5 milliards de paramètres mais un score 51 % sur SWE-Bench Pro) cible le codage agentique et s’intègre à GitHub Copilot, Visual Studio Code et plus largement à la stack Microsoft. Ses performances sont comparables à celles de Claude Haiku tout en étant meilleur marché.
MAI Image 2.5 et sa variante Flash sont bâtis pour les workflows créatifs des entreprises et se révèlent ultra-prometteurs : le modèle se classe notamment n°2 au classement Arena, « dépassant le score de Nano Banana 2 sur l’édition d’image », et n°3 sur la génération depuis un prompt textuel.
MAI-Transcribe-1.5 est carrément présenté comme le meilleur modèle de transcription du marché. L’éditeur met en avant une précision de pointe, une prise en charge de la terminologie métier dans 43 langues et une vitesse d’exécution annoncée à 5,7 fois celle des modèles rivaux, le tout pour 0,36 dollar l’heure d’audio. Un tarif et un discours volontairement offensifs, qui trahissent les visées de Microsoft sur ce segment.
Enfin, MAI-Voice-2 (et sa déclinaison Flash attendue très prochainement) est capable de générer une voix au rendu naturel dans 15 langues à partir d’un bref échantillon. D’autres langues sont promises à brève échéance.

Le portfolio est complet. Mais l’éditeur cherche surtout à contrôler davantage la chaîne de valeur, du silicium à la distribution. Les nouveaux modèles maison couvrent les grands blocs génératifs — raisonnement, code, image, transcription et voix — mais l’intérêt pour les DSI se joue surtout ailleurs. Trois points méritent une attention particulière :
D’abord, Microsoft revendique d’abord une optimisation matérielle avec Maia 200, présentée par Mustafa Suleyman (patron de la division Microsoft AI) comme offrant jusqu’à 1,4x de performance par watt sur les modèles MAI exécutés de bout en bout.
Ensuite, l’éditeur met ensuite en avant une provenance plus maîtrisée des données : Mustafa Suleyman insiste sur « une lignée de données propre, sous licence commerciale, et zéro distillation », gage de mise en production « en toute confiance ». Voilà qui va parler aux juristes, DPO et RSSI des entreprises.
Enfin, l’ouverture des modèles MAI à OpenRouter, Fireworks AI et Baseten – avec, pour la première fois, la possibilité d’ajuster soi-même les poids- combinée au « Frontier Tuning » de Microsoft Foundry (apprentissage par renforcement dans le périmètre de conformité du client, à partir de ses propres données et workflows, encore en préversion privée) confirme l’intention de l’éditeur : faire de MAI non pas une vitrine interne, mais une brique personnalisable et distribuable de sa plateforme agentique d’entreprise.
Microsoft veut conserver la liberté d’offrir à ses clients le choix du bon modèle pour le bon usage tout en disposant de ses propres modèles optimisés pour ses produits, son cloud, ses outils développeurs et ses scénarios d’entreprise. L’approche reste multi-modèles, mais l’éditeur ne veut plus être seulement l’intégrateur d’intelligences conçues ailleurs. Une chose est sûre : au rythme où progressent les modèles MAI, il va falloir désormais compter sur eux et les suivre de près.
GitHub Copilot devient une App, chef d’orchestre d’agents
Côté développement, GitHub Copilot poursuit sa mutation, et son symbole le plus parlant est une application de bureau inédite, la GitHub Copilot App, lancée en préversion technique. L’idée tient en une image : plutôt qu’un énième greffon dans l’éditeur de code, il s’agit d’un véritable poste de pilotage, distinct de l’IDE, pensé comme un centre de contrôle pour gérer plusieurs sessions d’agents en parallèle. Le développeur y lance une session à partir de ce qu’il a sous la main — une idée formulée en langage naturel, une tâche (issue), une demande de fusion (pull request) ou même une simple session précédente — et l’application va elle-même chercher le contexte dans les dépôts connectés.
Pour que ces agents ne se marchent pas dessus, chaque session s’exécute dans son propre git worktree, c’est-à-dire une copie réelle et isolée de la branche concernée, ce qui permet à plusieurs agents de travailler en parallèle sur le même dépôt sans écraser les modifications des autres. Mieux : l’application gère seule ces worktrees, sans configuration ni nettoyage manuel et sans jonglage de branches.
Copilot ne se limite d’ailleurs pas à produire du code. Via une fonction baptisée Agent Merge, il ouvre une pull request qui respecte les revues, vérifications et règles de fusion déjà en place dans l’équipe, puis répond aux commentaires de revue, corrige les contrôles d’intégration continue en échec et fusionne lorsque les conditions sont réunies, toujours dans le respect des règles de protection des branches.
Rayfin, le chaînon manquant entre prototype IA et production
Microsoft s’attaque aussi à l’un des grands angles morts du développement assisté par IA : le passage du prototype à la production. Les agents savent désormais générer très vite des interfaces, des scripts ou des applications simples. Mais les mettre en production dans un environnement d’entreprise suppose toujours de gérer les bases de données, les API, l’authentification, les règles d’accès, la supervision et l’infrastructure.
C’est précisément le rôle assigné à Rayfin, présenté en preview. Identités, stockage, schémas de base : Rayfin est un SDK agent-first qui branche les agents sur un backend-as-a-service managé dans Microsoft Fabric.
Le partenariat avec Replit en donne une démonstration parlante : le dev construit l’application dans Replit, mais « l’app et les données sont déployées dans le tenant Fabric managé par l’entreprise », via un simple « rayfin up », ce qui aboutit à un déploiement plus gouverné, plus robuste et plus conforme aux exigences d’entreprise..
Le besoin est réel : amener une application « vibe-codée » jusqu’à un backend conforme aux exigences de l’entreprise. Et la réponse de Microsoft est sans aucun doute pertinente. Mais, au passage, elle impose Microsoft Fabric, engendrant une dépendance supplémentaire.
Reste que Rayfin est une annonce importante car elle révèle la volonté de Microsoft de couvrir toute la chaîne de l’application agentique. Il ne s’agit plus seulement d’aider à écrire du code, mais d’industrialiser ce que les agents produisent. Dans le même mouvement, Azure HorizonDB, nouveau service PostgreSQL managé, est présenté comme une base de données pensée pour les exigences de performances et de fiabilité des applications IA et agentiques à grande échelle.
Gouverner les agents comme de nouveaux actifs numériques
Reste la question centrale : comment contrôler ces agents ? Microsoft répond avec Agent 365, qui étend Entra, Defender et Purview à l’observation, à la gouvernance et à la sécurisation des agents, quel que soit leur lieu d’exécution ou le framework utilisé. L’objectif est de donner aux DSI un plan de contrôle pour suivre les identités, les permissions, les comportements et les risques associés à ces nouveaux acteurs logiciels.
Le tout avec une approche multicloud. « Les agents peuvent être hébergés n’importe où : sur AWS, sur GCP, pas seulement sur Azure, et bâtis avec n’importe quel framework » affirme Satya Nadella.
L’annonce de la disponibilité générale du SDK Agent 365 et son extension aux agents locaux sous Windows complètent le dispositif, qu’épaulent côté poste de travail les Microsoft Execution Containers (MXC) et, côté défense, le harnais de sécurité multi-agents MDASH (nous y reviendrons prochainement).
Microsoft complète cette approche avec deux projets open source : ASSERT, pour l’évaluation de sûreté pilotée par politiques, et Agent Control Specification, qui vise à standardiser l’application des contrôles dans la boucle d’exécution des agents. Là encore, le message est très enterprise : les agents ne pourront se généraliser que s’ils deviennent auditables, gouvernables et compatibles avec les exigences de conformité.
Le prix de la cohérence
Cette Build 2026 confirme donc une inflexion majeure. Microsoft ne cherche plus seulement à ajouter de l’IA dans ses produits existants. L’éditeur assemble une plateforme complète pour une informatique d’entreprise dans laquelle les agents deviennent des acteurs à part entière : connectés aux données, outillés pour agir, gouvernés par les politiques internes, sécurisés par les plans de contrôle existants et alimentés par un portefeuille de modèles de plus en plus propriétaire.
Replacée dans son ensemble, l’architecture présentée est d’une cohérence redoutable : du silicium (Maia) aux modèles (MAI), du contexte (IQ) au substrat de données et de backend (Microsoft Fabric), du runtime (Microsoft Foundry, agents Windows) à l’outillage (GitHub Copilot App, Rayfin), jusqu’à la gouvernance (Agent 365).
Le pari reste ambitieux. Les entreprises devront encore trier entre annonces, previews, intégrations réelles et promesses de productivité. Elles devront surtout apprendre à concevoir des agents fiables, supervisables et alignés sur leurs processus, ce qui s’annonce bien plus complexe que ce que les grands acteurs de la Tech essayent de nous le faire croire.
Satya Nadella a clos sa keynote sur deux récits possibles de ce moment technologique, deux futurs possibles : celui où « la technologie concentre le pouvoir et réduit l’autonomie humaine », et celui où « cette vague débloque des opportunités pour les développeurs, les scientifiques et les entreprises de chaque communauté ». Et de conclure : « Notre travail, c’est de rendre la seconde histoire vraie. »
L’image est belle mais l’ironie qu’elle masque est saignante. Car l’architecture censée distribuer l’agentivité et libérer les opportunités est précisément celle qui concentre le plan de contrôle. D’autant que Microsoft tient simultanément trois rôles qui, ailleurs, s’excluraient : celui d’hôte neutre (11 000 modèles, briques MCP-native, gouvernance multi-cloud), de propriétaire intégré verticalement (modèles MAI + puces Maia + Foundry/Fabric), et d’arbitre indispensable (Agent 365). L’offre réduit indéniablement la corvée d’intégration, mais toute cette cohérence a un prix, qui est l’attraction gravitationnelle vers MS Fabric, MS Foundry, M365 et Agent 365. Il en résulte une tension que tout DSI, RSSI ou CTO devra peser avant de s’y abandonner.
À LIRE AUSSI :
À LIRE AUSSI :
