Le Web Conversationnel : un univers d'agents IA qui secondent l'utilisateur en situation de handicap pour lui permettre d'explorer le WEB

Newtech

En route vers le web conversationnel

Par Charlotte Mauger, publié le 08 juillet 2024

Des agents automatiques pourraient simplifier la navigation sur le web en réalisant, à la place de l’humain, les séquences d’actions ad hoc pour accomplir n’importe quelle tâche. Leur apprentissage nécessite des bases de données répertoriant les détails de fonctionnement des sites. Découvrez Mind2Web et le Web conversationnel…

Internet n’est pas aussi accessible qu’on pourrait l’espérer pour les personnes en situation de handicapC’est ce qu’estime Yu Su, chercheur à l’Université d’État de l’Ohio. En effet, la diversité des sites web, leurs interfaces ou les nombreuses étapes pour réussir une action rendent souvent difficile la navigation. Et les technologies d’assistance ne permettent pas toujours de s’en sortir.

Mais les choses pourraient changer avec les agents automatiques. Ces robots, appelés « agents généralistes d’Internet », sont basés sur l’intelligence artificielle et peuvent, à partir d’instructions formulées dans le langage de l’utilisateur, réaliser n’importe quelle tâche : rechercher dans la littérature, faire un comparatif entre deux technologies, interagir sur les réseaux sociaux…

Les utiliser serait aussi simple que de poser une question à un chatbot, d’où l’appellation « web conversationnel ». Via un plugin ou une fenêtre de commande, on pourrait demander à un robot de réaliser une tâche de navigation à notre place. À l’instar d’un humain, l’agent voit le site web – son code HTML et/ou son contenu visuel – et réalise la séquence d’actions nécessaire pour réussir la tâche. Sur son écran, l’utilisateur voit sa requête réalisée étape par étape sans besoin d’intervenir.

Pour réussir cette navigation, les agents généralistes reposent sur un ou plusieurs grands modèles de langage. « Mais ceux-ci ne sont pas assez entraînés sur ces tâches et on manque de données pour leur apprentissage et leur évaluation », explique Grégoire Mialon, chercheur chez Meta AI. Or, les sites internet sont très variés et l’ensemble des actions possibles sur internet est immense : certaines seront forcément oubliées.

Alors, pour que ces agents soient performants sur une diversité de tâches, même nouvelles, il faut trouver des méthodes qui peuvent être mises à l’échelle afin de constituer de grands ensembles de données de qualité et qui couvrent le plus d’usages possible. C’est dans ce contexte que s’inscrivent les travaux de Yu Su et de ses collègues : en décembre 2023, ils ont lancé Mind2Web, la première base de données en libre accès permettant de développer et entraîner des agents généralistes d’internet.

Pour l’heure, le nombre de sites choisis est assez restreint (137 sites sur le milliard existant), parmi cinq grands domaines : le voyage, le commerce, le service, le divertissement et les médias. C’est un début. « Mais ils ont fait attention à ce que les sites soient réels et diversifiés », apprécie Grégoire Mialon.


Déjà des préoccupations de sécurité

« Cette approche apporte beaucoup de possibilités, mais aussi de potentiels nouveaux risques », alerte Grégoire Mialon. En effet, contrairement à ChatGPT confiné dans sa boîte de dialogue, ces agents automatiques peuvent agir et réaliser tout ce qu’un humain peut faire sur Internet. Entre des mains mal intentionnées, ils pourraient être un levier de la cybercriminalité. « Il faudra revoir la typologie du risque liés aux grands modèles de langage », insiste le chercheur.



À LIRE AUSSI :

À LIRE AUSSI :

Dans l'actualité

Verified by MonsterInsights