Une IA spécialisée dans la reconnaissance des images peut développer spontanément une sensibilité très humaine pour les nombres. C’est en substance ce que des chercheurs affirment dans un papier publié par Science Advances.

L’IA porte extrêmement mal son nom. Elle n’a pas grand-chose d’intelligent et tout d’artificiel. Le terme est devenu marketing et tend à désigner l’intégration d’algorithmes de Machine Learning au sein de nos objets connectés, services et applications. Ces algorithmes permettent notamment à des « machines » d’acquérir des capacités de reconnaissance de « choses ».
Pour faire simple, ces algorithmes animent des réseaux de neurones virtuels que l’on forme en leur injectant des millions d’images pour les entraîner à reconnaître ce que l’on veut leur faire reconnaître : des situations dangereuses, des risques de cancer, des fleurs, des visages, etc.
De par leur entraînement, ces IA sont spécialisées dans le sujet sur lequel elles ont été « entraînées ». Et leurs algorithmes sont optimisés pour ce sujet.
En aucun cas, elles ne développent une « intelligence générale » comme l’esprit humain. C’est tout du moins la vision généralement admise. Pourtant, un récent papier de trois chercheurs en IA vient jeter le trouble dans cette vision.

Le sens de la numérosité

Dans un article publié par Science Advances, trois chercheurs en IA ont démontré qu’un réseau de neurones HCNN (Hierarchical Convolutional), entraîné pour reconnaître des objets au sein d’une image, pouvait développer spontanément une sensibilité aux nombres.
Dans la nature, humains et animaux possèdent un sens des nombres, une capacité naturelle à intuitivement déterminer le nombre d’objets sans avoir à les compter, simplement en regardant. Un humain sait en observant cinq poires, cinq chaises, cinq personnes, cinq billets ou le chiffre 5 que, sans même avoir à compter, toutes ces images ont une chose en commun : le concept abstrait de « cinq ».
Jusqu’ici, une IA apprenait à reconnaître les objets (chaise, poire, personne, billets…) et pouvait éventuellement les comptabiliser une à une un peu comme lorsque l’on compte avec ses doigts.
Mais la façon de procéder est différente chez les humains et les animaux qui naturellement ont une compréhension de la quantité de quelque chose. Autrement dit, les êtres vivants ont pour la plupart développé un sens de la numérosité qui leur permet notamment d’appréhender instantanément une situation dangereuse (pour évaluer la dangerosité d’un groupe) ou une opportunité (pour évaluer l’accessibilité de proies).

Un réseau de neurones peut acquérir un sens

Ce que les chercheurs démontrent, c’est qu’un réseau « deep neural » HCNN entraîné pour la simple détection visuelle d’objets peut lui aussi développer un tel sens de la numérosité. Ils ont en effet découvert que des unités spécifiques au sein du réseau de neurones se sont soudainement « paramétrées » pour abstraire la notion de nombre. Certaines unités se sont même mises à « préférer » les petits nombres. Dans leur article, les chercheurs démontrent que le réseau de neurones a ainsi développé un sens de la numérosité d’une façon étonnamment similaire à ce qui se passe dans le cerveau humain.

De telles recherches permettent d’en comprendre un peu plus sur le fonctionnement du cerveau et sur l’importance de l’expérience visuelle (et de l’apprentissage qui en découle) dans la structuration de la pensée et la capacité à abstraire des concepts. L’étude montre par la même occasion que les réseaux HCNN se rapprochent de plus en plus des processus naturels du cerveau et peuvent eux aussi développer des « sens ».

Bien sûr, Terminator n’est pas pour demain. Il faudra explorer et développer bien d’autres dimensions que la numérosité, notamment des dimensions émotionnelles, pour que des réseaux de neurones acquièrent l’intelligence fantasmée par les auteurs de science-fiction. Mais ces recherches montrent que les pistes actuellement suivies nous rapprochent effectivement du jour où l’IA sera plus intelligente qu’artificielle…

Source : Number detectors spontaneously emerge in a deep neural network designed for visual object recognition