Bard, Bing, ChatGPT, Claude, Llama 2, CM3leon... Voici les dernières nouvelles des IA

Data / IA

Bard, Claude 2, Bing Chat, ChatGPT Plus… Dernières nouvelles des IA

Par Laurent Delattre, publié le 21 juillet 2023

Bard est en France, Claude 2 aux US, Bing sait interpréter les images et se décline en mode entreprise. Quant à ChatGPT, il se transforme en Data Scientist… Voici les dernières nouvelles des IA génératives qui ont marqué le premier semestre 2023 et métamorphosé l’informatique.

Ces derniers jours, les annonces se sont multipliées autour des IA génératives. Or la période estivale, généralement moins intense, est l’occasion idéale pour les DSI de découvrir et apprivoiser ces IA génératives. Voici les principales annonces à retenir…

Google Bard disponible en Europe mais encore bridé

Il y a une semaine, Google lançait sans avertissement sa fameuse IA Générative BARD, basée sur le modèle LLM « PaLM2 » de Google et destinée à directement concurrencer Bing Chat et ChatGPT.
Bard est souvent considéré comme moins prolixe et moins percutant que ChatGPT Plus et Bing Chat. Mais il se montre parfois supérieur sur certaines tâches de programmation ou sur les résumés d’actualités. En revanche Bard ne supporte pas encore de Plugins mais la fonctionnalité est annoncée dans les semaines à venir.
Reste que la version française de l’IA conversationnelle de Google est pour l’instant un peu plus bridée que la version américaine. En effet, cette dernière s’est enrichie récemment d’une fonction « Google Lens » qui permet d’importer des images et de lancer une discussion autour, l’IA pouvant la décrire et en utiliser le contenu pour enrichir vos recherches. Autre nouveauté, cinq nouvelles options vous aident à modifier les réponses de Bard en l’encourageant à être plus simple, plus long, plus court, plus professionnel ou plus familier.


À LIRE AUSSI :

Claude 2 s’ouvre un peu plus et gagne en mémoire

Fondée par deux anciens d’OpenAI, la startup Anthropic est souvent présentée comme l’un des acteurs phares de l’IA générative. Elle vient de lancer « Claude 2 », la nouvelle version de son IA conversationnelle qui veut concurrencer ChatGPT. Claude 2 est un assistant IA de nouvelle génération qui peut effectuer diverses tâches de traitements de texte, comme analyser, résumer ou rédiger des romans entiers. Claude 2 se veut le plus robuste possible et moins victime d’hallucinations que ses concurrents mais se démarque surtout par sa capacité à analyser des documents de plus de 75.000 mots (là où GPT4 semble limité à 32000).
Claude 2 est désormais accessible à tout internaute américain ou anglais depuis le site claude.ai.


À LIRE AUSSI :

Bing Chat sait « lire » les images

Microsoft continue de faire évoluer Bing Chat, l’alter ego plus orienté recherches Web et connecté à l’actu de ChatGPT Plus. L’éditeur vient de lancer « Visual Search » une fonctionnalité qui permet de télécharger une image puis de discuter autour de celle-ci.
« Quel le monument présent dans cette photo ? », « Décris l’image ?», « De quelle époque provient cette photo ? », « Quelle est la recette de cuisine de ce plat photographié ? », « Où trouver ce produit photographié ? », « Transforme ce draft manuscrit en code HTML de page Web »…

Visual Search est la dernière amélioration en date de Bing Chat, l’IA gratuite de Microsoft. On savait que le modèle GPT-4 était multimodal et capable d’analyser le contenu d’images. Microsoft exploite la fonctionnalité avant OpenAI. Seule limitation connue, inutile de lui demander de reconnaître des visages : pour éviter tout débat et mauvais usage de la fonctionnalité, Bing Chat floute automatiquement tout visage avant de l’envoyer à l’IA.

Par ailleurs, Microsoft a annoncé cette semaine à l’occasion de sa conférence Inspire 2023, l’arrivée de Bing Chat Enterprise, une version réimaginée pour les entreprises et à même de garantir la confidentialité et la sécurité des informations confiées à l’IA pour analyse.

Nous reviendrons sur ces annonces IA la semaine prochaine dans notre compte rendu du Microsoft Inspire 2023.


À LIRE AUSSI :

ChatGPT Plus Code Interpreter ajoute la magie à l’IA

Les utilisateurs de la version « Plus » payante de ChatGPT ont désormais accès à une nouvelle fonctionnalité : Code Interpreter.
On le sait, le mécanisme de plugin introduit il y a quelques mois par OpenAI dans ChatGPT Plus (et qui sera aussi présent dans Bing Chat, Microsoft 365 Copilot et Windows Copilot) permet d’étendre les capacités de l’IA et lui inculquer de nouvelles capacités.
Code Interpreter découle de ce mécanisme et permet à l’IA d’exécuter directement du code Python dans l’environnement de discussion. Typiquement la fonctionnalité peut être utilisée pour l’analyse de données (l’IA se transforme alors en véritable Data Scientist), la conversion d’images, la modification de code, la transformation de fichiers audio, et plus encore. Fondamentalement, Code Interpreter permet à ChatGPT de ne plus uniquement se contenter de « causer » mais également « d’agir ». Nous reviendrons sur l’étonnant potentiel de cet ajout dans les prochains jours avec des exemples concrets d’utilisation.

Par ailleurs, ChatGPT s’enrichit également d’une nouvelle option dénommée “Custom Instructions” (instructions personnalisées). Disponible en bêta sur ChatGPT Plus, elle permet d’ajouter des préférences que ChatGPT doit impérativement prendre en compte au moment de formuler ses réponses. Par exemple, un enseignant qui élabore un plan de cours n’a plus besoin de répéter qu’il enseigne les sciences en troisième année. Un développeur qui préfère coder efficacement dans un langage autre que Python n’a qu’à le dire une fois pour être compris. Faire les courses pour une famille nombreuse devient plus facile, le modèle prenant en compte systématiquement les portions pour 6 personnes dans la liste des courses, dès lors que vous lui avez spécifié une fois que votre famille est composée de 6 gourmandes et gourmands.


À LIRE AUSSI :

Meta met son nouveau LLM « Llama 2 » en open-source

À contre-courant d’OpenAI, Google et Microsoft, Meta a décidé de publier en open source son nouveau modèle LLM dénommé Llama 2. De l’aveu même de Meta, Llama 2 n’est pas encore au niveau de GPT-4 dans ses capacités de discussion. Mais il est plus rapide et moins consommateur de puissance et peut satisfaire à bien des besoins d’interaction des chatbots d’entreprise.
Microsoft a d’ailleurs annoncé cette semaine la prise en charge de ce LLM sur ces infrastructures Cloud. Les clients Azure peuvent dès à présent affiner et déployer les modèles Llama 2 à 7B, 13B et 70B paramètres facilement et en toute sécurité pour créer et développer leurs propres applications d’IA générative. En outre, l’éditeur a annoncé optimiser Llama 2 pour un fonctionnement local sous Windows. Les développeurs Windows pourront ainsi utiliser et intégrer directement Llama dans leurs applications Windows en ciblant le fournisseur d’exécution DirectML à travers le Runtime ONNX.


À LIRE AUSSI :

Meta CM3leon veut concurrencer Dall-E et Midjourney

Et puisque l’on évoque les travaux de Meta en matière d’IA générative, l’éditeur a également dévoilé la semaine dernière son tout nouveau modèle de génération d’images. Dénommé CM3leon, ce modèle multimodal combine la génération de textes et d’images. Autrement dit il peut à la fois générer du texte à partir d’une image que générer une image à partir d’un texte.
Ce nouveau modèle CM3 (pour Causal Masked Mixed-Modal) – qui ne s’appuie pas sur des transformateurs – utilise 5 fois moins de puissance de calcul et combine l’adaptabilité des modèles autorégressifs à une efficacité accrue aussi bien dans les phases d’apprentissage que d’inférence.
Fruit d’un projet de recherche, on espère voir CM3leon se concrétiser sous forme de services accessibles à tous très rapidement.

A très vite pour d’autres nouvelles des IA…


À LIRE AUSSI :

Dans l'actualité

Verified by MonsterInsights