Monitorer les applications LLM en production est devenu un enjeu pour les entreprises qui ont déployé de nombreuses IA. Phospo propose un outil d’analyse pour générer des KPI métiers qui permettent d’évaluer la qualité des réponses de ces IA.
Les cas d’usage des LLM en entreprise sont aujourd’hui extrêmement divers. Parmiceux-ci, le copilote mis à disposition des collaborateurs pour répondre à leurs questions dans l’exercice de leurs tâches quotidiennes, l’assistant dédié au développement d’applications ou le chatbot sur le site web. Or, il est très complexe d’évaluer l’efficacité de ces IA, et bien plus encore de calculer leur ROI. Phospho a été créée comme une plateforme d’analyse permettant de pallier cette difficulté, en particulier pour l’IA conversationnelle. La start-up vise à devenir le Google Analytics ou le Contentsquare pour cette famille d’applications. « Nous permettons aux product managers, product owners et aux équipes data science de réaliser facilement des analyses NLP sur les prompts des utilisateurs et les réponses des LLM, explique Paul-Louis Venard, son CEO. Ils sont alors capables d’identifier les principaux cas d’usage, les personas, les centres d’intérêt, etc. Ils pourront ensuite comparer les performances des différents LLM dans plusieurs versions, vis-à-vis de KPI métiers qui dépendent vraiment du cas d’usage. » Les débuts sont prometteurs : depuis sa mise en ligne, il y a moins d’un an, la plateforme a délivré 1,4 million d’analyses.
Les ...
CET ESPACE EST RÉSERVÉ AUX ABONNÉS
Abonnez-vous dès maintenant
- ✓ Tous les articles d’IT for Business
- ✓ Le magazine mensuel en version numérique ou en version papier
- ✓ Les newsletters exclusives
Dans l'actualité
-
-
Huawei : accélérer l’IA en Europe grâce à un écosystème partenaire renforcé
Vincent Verhaeghe
29 Oct
-
Le marché mondial du PC poursuit sa bonne dynamique au troisième trimestre 2025
Laurent Delattre
29 Oct
-
Le cloud souverain, de la sémantique et surtout de la technologie
Thierry Derouet
29 Oct
-
Pour tout comprendre à la nouvelle structure d’OpenAI et à son nouveau partenariat Microsoft
Laurent Delattre
29 Oct
-
Arthur Kachka (Logitech) « Notre modèle 100 % indirect fait du channel un levier clé de croissance »
Frédéric Bergonzoli
29 Oct
-
IA confidente : Près d’un million de personnes évoquent le suicide avec ChatGPT chaque semaine
Laurent Delattre
28 Oct
-
Le GHT de Vaucluse teste un NDR avec succès
Alain Clapaud
28 Oct
-
TD SYNNEX Capital s’installe en France pour soutenir le channel
Frédéric Bergonzoli
28 Oct
-
SecNumCloud : quand l’État demande l’impossible aux PME du cloud
Laurent Delattre
28 Oct
