Apprentissage non supervisé pour la reconnaissance d'images

Data / IA

De l’apprentissage non supervisé pour la reconnaissance d’images

Par Pierre Berlemont, publié le 14 février 2023

La construction de son modèle d’interprétation s’avère complexe pour une IA lorsqu’elle n’est pas aidée par l’humain. Mais pas impossible : l’équipe Imagine du LIGM a obtenu des résultats prometteurs avec ses algorithmes d’apprentissage non supervisé, bien adaptés à l’analyse d’images satellitaires… ou d’œuvres d’art.

Pour reconnaître des photos, c’est-à-dire comprendre ce qu’elles représentent, une intelligence artificielle (IA) a le plus souvent besoin d’un apprentissage. L’utilisateur l’aide alors en associant des informations aux images présentées : il associera par exemple l’étiquette « chat » à une photo représentant l’animal domestique. Au fur et à mesure de cette supervision, l’IA va donc « apprendre » de cet ensemble de photos décryptées pour construire un modèle qui rapprochera le plus possible sa « vision » des photos de la réalité présentée.

Reconnaître des formes récurrentes

Lors d’un apprentissage non supervisé, l’IA n’est plus alimentée par des informations associées aux photos : à elle de découvrir des similitudes entre les images pour construire un modèle. C’est le sujet de prédilection de Mathieu Aubry, chercheur de l’École des Ponts ParisTech dans l’équipe « Imagine » du LIGM (Laboratoire d’Informatique GaspardMonge) : « Le principe de ce projet repose sur une identification par l’algorithme des formes cohérentes entre les images, afin de pouvoir les labelliser », explique-t-il.

Ces recherches ont pour but d’aider à l’analyse de collections d’images atypiques, difficiles à décrire avec un langage commun : typiquement des photos de documents historiques ou des photos satellites. Dans les premiers, qu’ils soient imprimés ou même manuscrits (avec des figures dessinées), de nombreux éléments se répètent (un graphique décoratif par exemple). À partir de ces morceaux qui se réitèrent, l’historien peut en déduire des informations comme l’origine de l’impression ou son époque…

À LIRE AUSSI :

Concernant les photos satellites, il est difficile même pour un être humain de se repérer dans une série temporelle massive d’images, et de comprendre ce qu’il faut annoter. « L’idée est de proposer un algorithme capable d’une pré-analyse sur le jeu de photos, à partir de laquelle un expert pourra travailler plus spécifiquement sur ses points d’intérêt », décrit Mathieu Aubry. Mais le rôle de l’humain reste prépondérant. Car si le programme développé va être capable de traiter à sa place de grandes quantités d’images – multispectrales dans le cas du satellitaire – et de détecter des patterns, seul l’expert peut juger de leur intérêt… ou pas.

L’analyse des images et des motifs récurrents permet sinon d’authentifier un tableau de Brueghel l’Ancien, du moins de s’assurer qu’il a été peint dans le même atelier ou à partir du même modèle.

Les premières expérimentations ont été réalisées sur un corpus d’œuvres du peintre du XVIe siècle Pieter Brueghel l’Ancien. Le motif étudié, une fleur, était copié à l’identique dans plusieurs œuvres. Même s’il ne permet pas de garantir la signature de l’artiste, sa présence indique au moins que le tableau a été peint dans le même atelier ou à partir d’un même modèle. Plus généralement, le programme détecte, parmi les éléments communs des œuvres, les caractéristiques les plus intéressantes.

Toujours en développement, l’algorithme de Deep Learning utilisé ici, en s’appuyant entre autres sur la bibliothèque PyTorch, peut bien sûr être amélioré. Le logiciel peut notamment encore passer à côté de certains éléments dans une image, alors que l’être humain les aura reconnus.

L’interprétabilité des résultats n’est pas non plus complètement maîtrisée, et l’objectif est d’éviter l’effet « boîte noire ».

Reste enfin la question d’échelle : le logiciel ne sait traiter pour l’heure que des corpus de quelques centaines d’images, loin des ensembles de dizaines de milliers espérés par la suite. Les progrès à réaliser seront sans doute facilités par la bourse de l’ERC (Conseil Européen de la recherche) obtenue par Mathieu Aubry.

Pour en savoir plus : projet ArtMiner

À LIRE AUSSI :

Dans l'actualité

Verified by MonsterInsights