2022- L’année des IA génératives

Data / IA

[Rétrospective 2022] L’année des IA génératives

Par Laurent Delattre, publié le 29 décembre 2022

L’année 2022 aura été largement marquée par une technologie : les IA génératives. Ces intelligences « créatives » à l’instar de Dall-E et ChatGPT ont fait faire un bond quantique à l’intelligence artificielle et vont transfigurer notre quotidien en entreprise en 2023…

Beaucoup de DSI et d’expérimentateurs de nouvelles technologies ont, en 2022, fait joujou avec des IA génératives. Elles s’appellent Dall-E, Point-E, Stable Diffusion, MidJourney, CoPilot, ou encore ChatGPT. Derrière ces noms barbares se cachent de nouvelles technologies de Deep Learning (GPT, GANs, etc.) capables de générer de toute pièce aussi bien du texte, du code de programmation, des images, des vidéos que des objets 3D.

Elles ont parfois été un peu survendues. Souvent on a essayé de leur faire faire ce pour quoi elles n’étaient pas conçues. À l’instar de ChatGPT que nombre de curieux voient comme une diseuse de vérité, le google du futur, une bible technologique, une arme cybercriminelle alors qu’elle n’est qu’une IA conteuse d’histoires, éduquée pour manier les langues et les mots afin d’entretenir des conversations quitte à inventer et non pour dire des vérités vérifiées et contrôlées.

Mais en 2023, ces nouvelles IA – encore très largement expérimentales – vont s’infiltrer dans le quotidien des développeurs, des journalistes, des rédacteurs, des créatifs pour leur permettre de trouver l’inspiration ou simplement d’être plus productifs.

Petit tour des IA de l’année…

ChatGPT

À tout seigneur tout honneur. C’est l’IA qui aura fait couler le plus d’encre. Nous lui avons accordé une large couverture dans notre papier : L’étonnante IA « ChatGPT » : ce que les DSI doivent absolument savoir en 10 points
Cette IA démontre les progrès spectaculaires réalisés pour transfigurer les interactions homme-machine et permettre un dialogue naturel entre les êtres humains et les IA.
Comme nous l’expliquons dans notre article, ChatGPT n’a pas été entraîné avec des bases de données certifiées, mais à manipuler les langues. Son objectif n’est pas de répondre avec justesse, mais de conter des histoires. Cette IA a une approche très tangentielle de la vérité. Elle peut s’en approcher et s’en éloigner dans la même phrase. Mais elle peut rendre de vrais services lorsqu’il s’agit de reformuler des phrases ou des idées, de trouver des titres, d’expliquer des technologies, d’illustrer des concepts techniques, de produire des histoires.
Une IA dont on va beaucoup parler en 2023, c’est une évidence.
Pour la découvrir : chatGPT de OpenAI

À LIRE AUSSI :

Dall-E 2

Créée par OpenAI, cette IA a surpris plus d’un spécialiste en générant des images à partir de mots. Demandez-lui « dessine-moi une licorne montée par un cosmonaute et galopant sur la Lune » et elle vous crée une œuvre originale. Certes, parfois, cette œuvre peut être très inspirée d’une autre. Mais cela reste une ‘création’ et non un copier-coller direct.
Le service est déjà très utilisé puisqu’il génère 2 millions d’images par jour.
Microsoft l’a intégré à son Microsoft Designer et s’apprête à l’intégrer à BING et à EDGE.
Pour la découvrir : DALL·E 2 de OpenAI

Stable Diffusion

Souvent plus artistique, plus complexe d’accès, mais ultra-prometteur, Stable Diffusion est un autre service qui crée des images à partir d’une description textuelle. Le service de Stability AI compte plus de 10 millions d’utilisateurs quotidiens. Le service s’est fait connaître en remportant un prix artistique !
Pour la découvrir : Stable Diffusion 2.1 Online demo ou le site officiel DreamStudio

MidJourney

Concurrent de Dall-E et Stable Diffusion, MidJourney est un outil de plus en plus utilisé par des artistes pour générer de nouveaux univers. MidJourney compte deux millions de membres et s’utilise par le biais d’un serveur Discord.
Pour la découvrir : Quick Start Guide – Midjourney

Point-E

C’est la dernière production en date d’OpenAI qui aura décidément eu une année 2022 très active ouvrant ces technologies au plus grand nombre. Point-E est un peu l’équivalent de Dall-E pour le monde de la 3D. Il génère des objets ou des scènes en 3D (au format Blender) à partir d’une description textuelle.
Pour la découvrir : Point cloud diffusion for 3D model synthesis

À LIRE AUSSI :

Make-A-Video et Imagen Video

Inspirés notamment par les travaux d’universités chinoises, à l’instar de CogVideo, Meta et Google ont chacun de leur côté dévoilé le fruit de leurs recherches avec des services permettant de générer des séquences vidéos à partir d’une description textuelle. L’accès à ces services est pour l’instant restreint.
À découvrir : Make-a-Video de Meta  et  Imagen de Google Research


CoPilot et AlphaCode : l’avenir du développement ?

AlphaCode de DeepMind (la startup sœur de Google) et CoPilot de GitHub (qui dérive de l’IA Codex de OpenAI) ont aussi fait couler beaucoup d’encre en 2022.
Ces outils permettent de générer automatiquement des lignes de code à partir d’une description textuelle du programme.
Ces IA sont présentées comme le second membre du ‘pair-pogramming’ secondant le développeur pour le rendre plus productif ou détecter d’éventuelles anomalies dans le code qu’il a écrit.
Toutefois, ces IA – tout comme les autres IA présentées ici – soulèvent actuellement bien des débats autour des copyrights car elles ne livrent pas les « sources » qui les ont inspirés pour générer leurs lignes de codes. Elle commettrait dès lors une violation des termes des licences open-source GPL, Apache et MIT qui imposent de rappeler les noms des auteurs.
En novembre dernier, on apprenait que le développeur et avocat Matthew Butterick poursuivait Microsoft ainsi que sa filiale GitHub et son partenaire OpenAI pour violation des licences open-source par l’IA Copilot !
Il faudra suivre l’évolution de cette affaire juridique en 2023. Les conséquences pourraient affecter toutes les IA génératives…

A découvrir :
AlphaCode de DeepMind
GitHub CoPilot


À LIRE AUSSI :

Dans l'actualité

Verified by MonsterInsights