Data / IA
Claude et Codex débarquent dans Agent HQ, GitHub multiplie les agents
Par Laurent Delattre, publié le 09 février 2026
Avec Agent HQ, GitHub ne se contente plus d’ajouter une couche d’IA à son offre. L’éditeur tente de faire du dépôt lui-même le « cockpit » où l’on assigne, pilote, observe et gouverne des agents de codage, y compris des agents tiers. Et désormais, ce cockpit peut piloter de multiples agents animés par des modèles différents : Claude d’Anthropic et Codex d’OpenAI font ainsi leur entrée officielle dans Agent HQ.
La fragmentation des outils d’IA dans l’écosystème du développement logiciel constitue un défi croissant pour les équipes techniques. Entre les agents de codage autonomes, les assistants intégrés aux IDE et les outils en ligne de commande, les développeurs jonglent avec une multitude d’interfaces déconnectées. GitHub entend y remédier avec l’ouverture de sa plateforme Agent HQ aux modèles tiers, permettant désormais d’exécuter Claude et Codex directement depuis l’environnement GitHub.
Annoncé en octobre dernier, GitHub Agent HQ est la vraie réponse de Microsoft/GitHub à la menace des solutions Claude Code et OpenAI Codex. Agent HQ est la vision « hub » de GitHub pour l’ère des agents. Ce nouveau cockpit agentique veut transformer GitHub en écosystème ouvert où plusieurs agents cohabitent sur une même couche d’orchestration, au lieu de multiplier les assistants dispersés entre IDE, chat, extensions et outils SaaS. Agent HQ veille à intégrer les agents IA nativement au cœur des flux de travail GitHub. En clair, les agents IA ne vivent pas dans un chatbot à côté du projet, ils s’insèrent directement dans l’environnement GitHub et les workflows quotidiens des équipes de développement : une issue à traiter, une pull request à préparer, une branche à faire évoluer, une chaîne CI à faire passer, des règles de gouvernance à respecter…
Le cœur opérationnel d’Agent HQ s’appelle « mission control ». Cette console permet d’assigner des tâches à plusieurs agents simultanément, de suivre leur progression en temps réel et de gérer leurs résultats comme n’importe quelle contribution humaine, avec des traces d’exécution et des artefacts directement rattachés au dépôt.
Plutôt qu’un tableau de bord à part, c’est une couche de contrôle universelle qui suit le développeur sur toutes ses « surfaces de travail » : le web GitHub, Visual Studio Code, le mobile, jusqu’au CLI.
Ainsi, l’orchestration agentique s’adapte au lieu où le développeur code et révise, sans le forcer à basculer d’outil en outil ou à changer de rythme. Mieux encore, les agents opèrent dans le périmètre de sécurité de GitHub, héritant des contrôles d’identité, des permissions de branches et des journaux d’audit utilisés pour les collaborateurs humains. Cette approche se distingue des outils agentiques autonomes qui nécessitent généralement des permissions étendues sur l’ensemble d’un dépôt pour fonctionner sans accroc.
En pratique, Agent HQ s’appuie sur une gestion de sessions d’agents. Son cockpit « Mission Control » centralise les sessions. Tout dépôt GitHub éligible se voit doté d’un onglet « Agents » qui permet de démarrer, surveiller et reprendre des travaux agentiques (qui peuvent être menés en parallèle) sans quitter le contexte du « repo ». La logique est asynchrone. Une fois la tâche assignée, l’agent travaille, produit des éléments révisables, comme des commentaires, des brouillons, des changements proposés, et l’on revient ensuite pour arbitrer, contrôler, demander des corrections, ou merger. Cette exécution asynchrone est précisément ce que GitHub veut industrialiser à l’échelle d’une équipe, avec des traces associées aux décisions et à l’historique du dépôt.
Un marché des agents de codage en pleine effervescence
L’initiative de GitHub intervient dans un contexte de multiplication des solutions d’agents de codage. Plusieurs acteurs majeurs se disputent ce marché en pleine expansion.
Cursor s’est imposé comme l’IDE de référence pour le développement assisté par IA. Construit sur une base VS Code, il propose une intégration profonde de l’intelligence artificielle avec des fonctionnalités de complétion contextuelle, de refactoring et un mode agent capable de travailler sur des tâches complexes multi-fichiers. Son approche « GUI-first » séduit les développeurs recherchant une expérience visuelle fluide.
Kiro d’AWS, l’environnement agentique qui adopte une approche singulière baptisée « spec-driven development » : l’IDE génère d’abord des spécifications structurées (user stories, design technique, liste de tâches) avant d’écrire le moindre code. Amazon a fait de Kiro son environnement de développement standard en interne, rapportant sur un projet avoir réduit un chantier de 18 mois avec 30 développeurs à seulement 76 jours avec 6 personnes.
Claude Code, l’outil en ligne de commande d’Anthropic, adopte une philosophie radicalement différente. Orienté terminal, il excelle dans l’automatisation de tâches complexes et l’orchestration de multiples agents en parallèle. Sa fenêtre de contexte étendue de 200 000 tokens (1 million de tokens en bêta avec le nouveau modèle Opus 4.6) lui permet de comprendre des bases de code volumineuses dans leur globalité.
OpenAI Codex propose une approche cloud-native avec des environnements d’exécution isolés. La version GPT-5.3-Codex, lancée le 5 février 2026, introduit des capacités de compaction de contexte permettant des sessions de travail prolongées sur des projets d’envergure.
D’autres acteurs comme Google Jules (basé sur Gemini), Devin de Cognition ou encore Gemini CLI enrichissent cet écosystème, chacun avec ses spécificités. Cette prolifération crée précisément le problème qu’Agent HQ cherche à résoudre : comment tirer parti de cette diversité sans multiplier les interfaces et les abonnements ?
Agent HQ a toujours été conçu comme un univers ouvert… ouvert aux autres modèles agentiques, même si jusqu’à présent seul Copilot était disponible.
Et, depuis début février, les abonnés Copilot Pro+ et Copilot Enterprise peuvent accéder à Claude d’Anthropic et à GPT-5.3-Codex d’OpenAI directement depuis GitHub et VS Code. Ces deux modèles sont actuellement considérés comme les références en matière de codage agentique. « Nous amenons Claude dans GitHub pour rencontrer les développeurs là où ils sont », explique Katelyn Lesse, Head of Platform chez Anthropic. « Avec Agent HQ, Claude peut créer des commits, commenter des pull requests, permettant aux équipes d’itérer et de livrer plus rapidement et avec plus de confiance. »
L’utilisateur peut choisir entre Copilot, Claude et Codex au moment de créer une tâche, lancer plusieurs agents, suivre l’avancement, puis relire les logs et les changements comme il relirait le travail d’un pair. Chaque session d’agent consomme une requête premium. Les agents doivent être explicitement activés dans les paramètres avant utilisation, permettant aux organisations de contrôler leur déploiement.
Comparer les approches et les modèles
L’un des apports majeurs d’Agent HQ réside dans la possibilité de comparer comment différents agents abordent un même problème. Les utilisateurs peuvent assigner une même tâche simultanément à Copilot, Claude et Codex, puis analyser leurs raisonnements et leurs solutions respectives.
Dans un contexte où les modèles d’IA évoluent rapidement et où leurs forces respectives varient selon les types de tâches, pouvoir ainsi mettre en concurrence les différents modèles sur des problématiques concrètes représente à nos yeux un avantage décisif pour les équipes d’ingénierie logicielle et les développeurs. Tous les modèles agentiques ne se valent pas selon les tâches. Certains excellent en refactoring massif, d’autres en écriture de tests, d’autres encore en diagnostic de bugs ou en compréhension d’un historique de Pull Request. Même quand ils convergent vers une solution fonctionnelle, ils divergent souvent sur la structure, les compromis, la dette technique implicite, ou la rigueur de validation.
Cette capacité de benchmarking multimodèles en conditions réelles présente plusieurs avantages opérationnels. Un agent peut évaluer la modularité et le couplage d’un code pendant qu’un autre se concentre sur les cas limites et les problèmes de scalabilité. Un troisième peut proposer l’implémentation la plus conservatrice pour minimiser les risques de régression.
Ainsi, elle permet non seulement de comprendre les qualités, défauts et limites de chaque modèle mais également d’éclairer les réflexions stratégiques. Cette exécution parallèle est un moyen de faire émerger plus tôt des compromis et des cas limites, avant que le code ne se fige de trop. Imaginons une pull request. Au lieu de passer 30 minutes à vérifier la qualité du code ligne par ligne, le développeur peut assigner cette tâche à Claude et à Codex. Pendant ce temps, il analyse les résultats des deux agents pour voir si l’un détecte un problème de couplage que l’autre a manqué, ou si leurs suggestions divergent sur un point architectural fondamental. Les ingénieurs passent moins de temps sur la plomberie et se concentrent sur des questions plus fondamentales de montée en charge, de dépendances, etc.
Pouvoir faire exécuter le même ticket par plusieurs agents, dans le même contexte de dépôt et avec les mêmes règles de revue, transforme la comparaison en activité opérationnelle. Cela permet d’arbitrer sur pièces, avec diff, logs, discussion et Pull Request, plutôt que de se fier à de simples impressions issues d’un chat externe.
Enfin, c’est aussi une manière pragmatique de réduire le risque de dépendance à un seul fournisseur.
Un arsenal complet pour les équipes de développement
Au-delà de l’exécution d’agents, GitHub Agent HQ offre un ensemble de fonctionnalités conçues pour l’entreprise. Les sessions d’agents peuvent être démarrées depuis l’onglet « Agents » de n’importe quel dépôt, depuis les issues ou les pull requests. Il est possible d’assigner un agent à une issue existante, voire de mentionner @Copilot, @Claude ou @Codex dans les commentaires pour déclencher des analyses complémentaires.
Les agents fonctionnent de manière asynchrone par défaut. Leurs travaux produisent des artefacts (commentaires, brouillons, modifications proposées) qui s’intègrent aux workflows de revue existants. Toute l’activité est journalisée et auditable.
La plateforme intègre également GitHub Code Quality (en preview publique), qui étend les vérifications de sécurité de Copilot pour évaluer la maintenabilité et la fiabilité du code. Un tableau de bord de métriques permet de suivre l’impact de l’IA sur la productivité à l’échelle de l’organisation.
Côté gouvernance, le « Control Plane » centralise la gestion des accès et des politiques de sécurité. Les administrateurs peuvent définir quels agents et quels modèles sont autorisés, configurer les journaux d’audit et obtenir des métriques détaillées sur l’utilisation de Copilot dans leur organisation.
Enfin, la capacité à créer des agents personnalisés, versionnés et outillés, change la donne en interne. Les profils d’agents permettent de capturer des règles de code, des préférences d’architecture, des contraintes de sécurité, et même de restreindre ou élargir l’accès aux outils, y compris via MCP. C’est la base d’une industrialisation qui évite le « prompt artisanal » et permet de produire des agents alignés sur les standards maison.
La suite, d’autres agents et modèles en approche
GitHub ne compte pas s’arrêter là. L’éditeur travaille activement avec Google, Cognition (éditeur de Devin) et xAI pour intégrer leurs agents respectifs dans Agent HQ. L’accès à Claude et Codex sera également étendu à d’autres types d’abonnements Copilot dans les mois à venir.
L’intégration de Claude et Codex ne se limite pas à ajouter deux « gros noms » de plus à GitHub Agent. Elle valide l’idée que, pour les entreprises, l’enjeu passe désormais du choix d’un assistant à la capacité à opérer un portefeuille d’agents, à les comparer, et à les gouverner.
Agent HQ veut devenir une couche universelle où les meilleurs agents et modèles sont interchangeables, pilotés depuis un même endroit, avec une gouvernance cohérente. Comme le résume Katie Norton, analyste chez IDC, « avec Agent HQ, GitHub se repositionne comme le tissu de coordination du développement logiciel agentique, où humains, agents et politiques d’entreprise convergent à travers les IDE, les modèles et les dépôts. »
Un moyen pour GitHub d’imposer sa plateforme comme une opportunité de structurer l’adoption de l’IA générative et agentique dans les équipes de développement, avec les garde-fous de gouvernance et de sécurité attendus par les entreprises.
À LIRE AUSSI :
À LIRE AUSSI :
