Data / IA

Devstral : l’IA agentique qui code, teste et automatise les Devs sans imposer le cloud

Par Laurent Delattre, publié le 26 mai 2025

La startup française star de l’IA Européenne, Mistral AI, dévoile Devstral, son nouveau modèle d’IA de codage aux capacités agentiques et spécialement conçu pour résoudre des problèmes logiciels réels. Cette solution open-source s’inscrit dans un paysage rapidement devenu très concurrentiel. Mais la jeune pousse a un atout de poids dans sa manche : l’exécution en local.

Vous l’aurez sans doute remarqué, les derniers LLM sortis mettent d’abord en avant leurs capacités à coder, à développer du code informatique. Google a largement mis en avant cet aspect en annonçant ces modèles hybrides à raisonnement Gemini 2.5 Flash et Pro. OpenAI en avait fait autant en annonçant OpenAI o3, mais présente également « OpenAI o4-mini-high » comme « idéal pour le codage » et « GPT-4.1 » comme « recommandé du codage ». En fin de semaine dernière, Anthropic est revenu dans la course avec ses modèles Claude 4 Opus et Sonnet tout en les présentant comme des modèles qui définissent de « nouveaux standards en matière de codage », qualifiant même « Claude 4 Opus » de « meilleur modèle de codage au monde » et « Claude 4 Sonnet » de « modèle délivrant des capacités de codage supérieures » … C’est à se demander si ces modèles savent au final faire autre chose ! Bien évidemment ! Mais cette instance démontre à quel point l’IA a déjà transformé le métier de développeurs et s’est inscrit dans son quotidien, en faisant un marché majeur pour les LLM.

Mais comme le rappelait Forrester dans un récent rapport, un développeur en entreprise ne passe réellement en moyenne que 24% de son temps à coder, le reste étant dédié aux tests, à la recherche et correction de bugs, aux meetings, à la configuration et assemblage des environnements de Dev, etc. Une façon aussi pour Forrester de rappeler que si l’IA veut vraiment augmenter la productivité des développeurs, elle ne doit pas se focaliser sur le codage et chercher à optimiser et automatiser les 76% autres du temps des Devs.

Et c’est exactement la mission que poursuivent la nouvelle génération d’agents de codage (Coding Agents) qui envahissent le paysage depuis quelques semaines : Cursor de Anysphere, Devin de Cognition, Windsurf (ex-Codeium), Claude Code, OpenAI Codex Agent et les deux dernières stars du moment annoncées la semaine dernières Google Jules (en complément de Google Code Assist) et surtout GitHub Copilot Coding Agent. Ces agents peuvent rédiger des documentations, monter des environnements de développement, générer des tests, et automatiser nombres de tâches chronophages et répétitives du métier de développeurs. Tous partagent la même promesse : transformer un simple LLM en collaborateur virtuel capable de raisonner, de parcourir un dépôt, d’exécuter des tests et de proposer des correctifs complets, etc. Dit autrement, ces systèmes, doués d’une autonomie et de capacités de raisonnement accrues, ne se contentent plus d’assister passivement les développeurs ; ils agissent comme de véritables collaborateurs, capables de prendre des initiatives, de résoudre des problèmes complexes et d’opérer sur l’ensemble du cycle de vie du développement logiciel (SDLC).

Gartner identifie les agents IA comme la “prochaine grande innovation” (“next big thing”) et estime que l’adoption systématique des agents assistants aux développeurs fera grimper la productivité développeur d’au moins 36 % d’ici 2028.

Malgré la multiplication récente des « Coding Agents » sur le marché, la face cachée des IA d’assistance au codage subsiste : hallucinations logiques, génération de vulnérabilités, dérives de licences tierces, exposition accrue des secrets d’entreprise lorsque le traitement reste externe et risque d’ultra dépendance à un fournisseur Cloud.

Devstral : la réponse open-source de Mistral AI à l’ère agentique

C’est dans ce contexte que Mistral AI a lancé en fin de semaine dernière son premier agent de codage, Devstral ! Conçu en partenariat avec la start-up All Hands AI Devstral est un « coding agent » s’appuyant sur un modèle éponyme de 24 milliards de paramètres avec une fenêtre contextuelle de 128 000 tokens.
Taillé pour les tâches d’ingénierie logicielle complètes, Devstral a été affûté sur des tickets GitHub réels via des cadres comme OpenHands ou SWE-Agent ; il sait donc modifier plusieurs fichiers, respecter les conventions du dépôt et valider ses changements par les tests. Il peut contextualiser le code au sein de larges bases de code, identifier les relations entre des composants disparates et détecter des bugs subtils dans des fonctions complexes.

Sur le benchmark SWE-Bench Verified (500 issues réelles), il atteint 46,8 % de résolution, soit plus de six points devant le meilleur modèle open-source précédent et plus de vingt points devant GPT-4.1 Mini dans le même environnement d’évaluation.

Mais ce qui fait la grande force et la grande originalité de Devstral, c’est sa flexibilité de déploiement et sa capacité à s’exécuter en local. Un PC avec un GPU RTX 4090 ou un Mac doté de 32 Go de RAM suffisent pour l’inférence locale, ouvrant son adoption privilégiée aux équipes dont les DSI et RSSI interdisent l’envoi de code sensible vers le cloud.

Distribué sous licence Apache 2.0, Devstral peut être intégré sans contrainte commerciale dans un IDE, un pipeline CI/CD ou un bastion on-prem.

« Devstral excelle à explorer les bases de code et à éditer plusieurs fichiers » explique l’éditeur.

Comme tous les “coding agents”, Devstral n’annule pas le principe de revue humaine. Les tests qu’il exécute ne couvrent que ce qui est déjà spécifié ; ils ne garantissent ni l’absence de failles logiques ni la conformité aux standards internes.

Un jalon vers des agents plus autonomes

Mistral qualifie Devstral de « research preview » et annonce déjà une version plus large. Entre-temps, l’écosystème open-source s’approprie le modèle via Hugging Face, Ollama ou vLLM, parfois en le couplant à des RAG internes pour enrichir le contexte métier.

Il est également accessible via l’API Mistral sous le nom “devstral-small-2505” au même tarif que Mistral Small 3.1 : 0,1 dollar par million de tokens d’entrée et 0,3 dollar par million de tokens de sortie. Pour les déploiements d’entreprise nécessitant un fine-tuning sur des bases de code privées ou des personnalisations avancées, Mistral AI propose un accompagnement dédié via son équipe d’IA appliquée.

Pour les DSI et RSSI, l’arrivée de Devstral confirme que l’agentic engineering n’est plus réservée aux géants du cloud : elle devient déployable en local, audit-friendly et financièrement compétitive. La course ne fait que commencer, mais le terrain de jeu s’élargit – avec, à la clé, autant d’opportunités que de risques à piloter. Aux DSI de rapidement mettre en place une approche réfléchie pour vérifier la crédibilité et fiabilité des solutions mais aussi l’acceptation et l’impact organisationnel de telles solutions. Et même si les solutions sont encore très émergentes et immatures, il n’y a en réalité pas de temps à perdre.

À LIRE AUSSI :