Pour tout savoir sur GPT-4

Data / IA

GPT-4 : 10 questions et réponses pour tout comprendre

Par Laurent Delattre, publié le 16 mars 2023

La sortie d’une nouvelle IA chez OpenAI ne passe jamais inaperçue. Surtout lorsque celle-ci est destinée à animer prochainement ChatGPT. Alors que GPT-3 et ChatGPT ont largement démontré le potentiel de l’IA dans les processus des entreprises, l’arrivée de GPT-4 ne peut qu’éveiller l’intérêt des DSI. Voici les premières clés pour comprendre GPT-4 et son futur impact…

Comme attendu, OpenAI a bien officialisé cette semaine son nouveau modèle d’intelligence artificielle qui fait suite à GPT-3 le modèle LLM qui a popularisé les usages de l’IA générative aussi bien au travers du chatbot ChatGPT qu’au travers de la naissance de services comme GitHub Copilot, Einstein GPT, ClosersCopy, Jasper.ai, et tant d’autres.

Selon l’éditeur, le nouveau modèle peut mieux analyser les nuances dans les instructions des utilisateurs, analyser les images, se montrer plus précis et détaillé dans ses réponses et maintenir les contextes de conversations étendues.

Quelques heures à peine après avoir été divulgué, GPT-4 envahissait déjà la twittosphère avec des témoignages de toutes sortes mettant en lumière les prouesses du nouveau modèle, les améliorations par rapport à ChatGPT et les capacités uniques de cette nouvelle IA déjà expérimentées dans des contextes professionnels. Qu’en est-il exactement ?

Qu’est-ce que GPT-4 ?

« GPT-4 est un modèle de type Transformer pré-entraîné pour prédire le prochain élément d’un document, en utilisant à la fois des données accessibles au public (telles que les données Internet) et des données sous licence de fournisseurs tiers. Le modèle a ensuite été affiné à l’aide de l’apprentissage par renforcement à partir du retour d’humains » explique OpenAI.

Si GPT-3 était exclusivement un modèle linguistique LLM (Large Language Model), GPT-4 est bien davantage un LMM (Large Multimodal Model), un modèle multimodal capable de cumuler en entrée des images et du texte, d’analyser des images et questions associées posées en langue naturelle, pour répondre à des questions complexes impliquant des éléments visuels. Tout comme GPT-3, GPT-4 peut aussi générer du code informatique pour résoudre une problématique exprimée en langage naturel.
Enfin, GPT-4 comprend et s’exprime en de multiples langues (il connaît plus de langues que GPT-3).

Caractéristiques de GPT-4 : entre fantasme et réalité ?

Jusqu’ici, l’univers de l’IA était assez ouvert avec comme bonne pratique de publier des articles techniques sur xarchiv dévoilant les détails techniques de toute nouvelle implémentation. Mais le sujet est désormais au cœur de guerres commerciales entre les géants de la Tech et les habitudes changent. Ainsi, OpenAI n’a plus publié les codes sources de ses « GPT » depuis « GPT-2 ». L’éditeur a franchi cette semaine une nouvelle étape dans la guerre des secrets. Son ‘papier technique’ ne dévoile aucun détail technique. Il explique ouvertement que « étant donné le paysage concurrentiel et les implications en matière de sécurité des modèles à grande échelle comme GPT-4, ce rapport ne contient pas d’autres détails sur l’architecture (y compris la taille du modèle), le matériel, le calcul d’entraînement, la construction de l’ensemble de données, la méthode d’entraînement, ou d’autres éléments similaires ».

Ainsi, on ne sait pas par exemple le nombre de paramètres utilisés par le modèle. GPT-3 s’appuyait sur 175 milliards de paramètres. Certains avaient fantasmé des chiffres invraisemblables pour GPT-4, les 1 600 milliards de paramètres étant le chiffre le plus souvent cités. OpenAI a démenti dès février ces affabulations. Apparemment GPT-4 n’utilise pas beaucoup plus de paramètres que GPT-3.5. Les optimisations sont plutôt d’un autre ordre.

Avec quelles données GPT-4 a-t-il été entraîné ?

Le modèle GPT-4 a été entraîné avec des données publiques sur internet et un certain nombre de sources professionnelles (notamment légales) acquises par OpenAI.

La plupart des sources publiques ont été arrêtées à Octobre 2021. Dès lors, GPT-4 n’a pas de connaissances vraiment plus récentes que ChatGPT.

Il a également été entraîné avec des sources d’images pour acquérir ses compétences multimodales.

En quoi GPT-4 diffère-t-il de GPT-3.5 ?

Selon OpenAI, GPT-4 et GPT-3.5 (le modèle sous-jacent à ChatGPT) sont « simplement différents » dans leur fonctionnement mais « GPT-4 se révèle plus fiable, plus créatif et capable de gérer des instructions beaucoup plus nuancées que GPT-3.5. »

L’éditeur reconnaît cependant que « dans une simple conversation, la distinction entre GPT-3.5 et GPT-4 peut être subtile. La différence apparaît lorsque la complexité de la tâche demandée atteint un seuil suffisant ».


À LIRE AUSSI :


Concrètement, GPT-4 diffère cependant clairement de GPT-3 sur quelques points bien déterminés :

GPT-4 est multimodal. On peut lui envoyer des images puis lui poser des questions sur leur contenu, leur message, leur contexte, leur caractéristique…

GPT-4 peut adopter différentes personnalités. C’était déjà un peu le cas de ChatGPT mais c’était plus une imitation qu’une personnalité. « Plutôt que la personnalité classique de ChatGPT avec une verbosité, un ton et un style fixes, les développeurs (et bientôt les utilisateurs de ChatGPT) peuvent désormais prescrire le style de leur IA » précise OpenAI. Pour cela, l’API dispose d’un nouveau paramètre « System Message » qui permet de définir la personnalité (le ton, le style, le vocabulaire) que l’IA doit employer dans ses réponses.

GPT-4 peut accepter, générer et se souvenir plus de 25 000 mots (soit 50 pages de textes) avant de perdre le contexte et de devoir régénérer la session. C’est 5 fois plus que ChatGPT et 8 fois plus que GPT-3.

GPT-4 est plus doué en calcul et en logique que ChatGPT.

GPT-4 résulte de plus d’un an expérimentation ouverte de GPT-3 et de près de 3 mois de ChatGPT. Ses paramètres internes ont été ajustés pour obtenir des réponses plus éclairées et plus précises.

GPT-4 est-il aussi intelligent qu’un humain ?

Selon OpenAI, « bien qu’il soit moins performant que les humains dans de nombreux scénarios du monde réel, GPT-4 affiche des performances de niveau humain sur divers benchmarks de référence professionnels et académiques ».

Ainsi sur un examen du barreau, la note obtenue par GPT-4 se situe au niveau des 10% de candidats ayant obtenu les meilleures notes, là où GPT-3 se situait au niveau des 10% de moins bonnes notes.

D’une manière générale, GPT-4 est moins intelligent qu’un humain parce qu’il n’a pas notre capacité de captation et d’interaction avec le monde qui nous entoure. Ces capacités cognitives restent limitées mais au jeu des questions/réponses son savoir dépasse celui des humains.

Enfin, comme nous l’expliquions déjà dans notre présentation de ChatGPT, ce type d’IA “Transformer” ont une approche très “tangentielle” avec la vérité. D’une manière générale, elle se sente obliger de répondre quelque chose. Quand la “vérité” n’est pas directement disponible dans sa base d’apprentissage, elle tend à s’en éloigner de plus en plus jusqu’à ce que le modèle ait matière à répondre. ChatGPT est une IA “générative” autrement dit “créative”. Elle “crée” plus qu’elle ne “répond”.

Quelles sont les limites et faiblesses de GPT-4 ?

Les limites et faiblesses de GPT-4 sont pour l’instant encore difficiles à déterminer d’autant que cette première version est volontairement bridée par OpenAI.

Il n’est pas plus connecté à Internet que ChatGPT. Il n’actualise pas ses connaissances en temps réel et sa base de connaissances – dans bien des domaines  – s’arrête à Octobre 2021. De plus, son apprentissage s’appuie sur des documents internet non certifiés comprenant des biais humains qui n’ont pas été « nettoyés ».

GPT-4 est limité par un vaste ensemble de garde-fous conçus par les humains et leurs biais.

GPT-4 maîtrise mieux l’anglais que les autres langues (même si sa maîtrise du français est déjà remarquable).

GPT-4 peut, comme ChatGPT, « halluciner », autrement dit affirmer des faits totalement faux (Elvis Presley est le fils d’un acteur par exemple) avec un aplomb confondant. On ne peut donc jamais faire aveuglément confiance à ses réponses.
Toutefois, par rapport à ChatGPT, GPT-4 se montre 82% moins enclin à se laisser répondre à des contenus « interdits » et produit des réponses factuelles justes plus fréquemment (40% d’amélioration).

GPT-4 peut faire des erreurs (comme générer du code avec des vulnérabilités), faire des erreurs de raisonnement sur des questions parfois très simples (comme des calculs enfantins), et peut se montrer inconsistant dans ses réponses quand on lui pose la même question plusieurs fois… Mais après tout, les humains aussi font des erreurs et ne sont pas totalement fiables !

Qu’est-ce que GPT-4 sait faire que ChatGPT ne sait pas faire ?

La question est encore ouverte, mais on sait déjà que GPT-4 peut faire de nouvelles choses :

Décrire des images et répondre à des questions sur ces images.
Coder des programmes complets (ChatGPT générait du code mais plutôt pour concrétiser une fonction). Des internautes ont déjà généré des Pong, Snakes et autre Tetris avec GPT-4, directement jouables.
Créer des sites Web complets.
Expliquer son raisonnement : on peut en effet lui demander comment il est arrivé à un résultat donné, GPT-4 détaille alors son raisonnement.

Comment GPT-4 peut-il être utilisé dans votre entreprise ?

GPT-3 et ChatGPT ont déjà fait leur entrée en entreprises au travers de différentes extensions de navigateurs et différentes fonctionnalités IA intégrées récemment à bien des services et logiciels.

En outre GPT-4 sert de fondation aux IA conversationnelles et génératives « Copilot » que Microsoft est en train de déployer aussi bien dans Dynamics 365 que dans Microsoft 365.


À LIRE AUSSI :


Par exemple, Microsoft 365 Copilot permet de prioriser les emails; résumer emails, textes et présentation ; générer des notes de présentation pour vos slides PowerPoint ; résumer des réunions ou des chats Teams ; faire des comptes-rendus de réunions avec une liste de choses à faire ; réécrire des textes ; suggérer des idées, titres, introductions, conclusions ; ajouter des animations dans PowerPoint ; transformer un slide textuel en images ; mettre en évidence des tendances dans des données Excel ; etc.

GPT-4 est disponible sous forme d’API. Il peut donc aisément s’insérer dans les processus et logiciels en place. Il devrait rapidement révolutionner les « Chatbots ». Mais partout où les interactions homme-machine gagnent à être exprimées en langage naturel, GPT-4 promet de révolutionner les façons de travailler.

Comment peut-on essayer GPT-4 ?

L’API GPT-4 est d’ores et déjà disponible et accessible. On peut aisément y accéder depuis le « Playground » d’OpenAI ou depuis des scripts Python par exemple.

Par ailleurs GPT-4 est désormais accessible via ChatGPT Plus la version payante de ChatGPT.

Enfin, GPT-4 est le modèle qui anime l’intelligence artificielle BING ! Plus d’un million d’utilisateurs y ont donc accès depuis près d’un mois sans le savoir. Par ailleurs Microsoft a libéré son IA Bing cette semaine. Il n’y a plus de liste d’attentes. Il faut toujours s’inscrire comme volontaire mais la validation est quasiment instantanée.

À LIRE AUSSI :


Pourquoi la gestion des images n’est-elle pas encore accessible ?

Les fonctionnalités multimodales ne sont pour l’instant pas accessibles. GPT-4 est volontairement bridé par OpenAI pour l’instant qui cherche encore à évaluer les risques de cette IA.

Ainsi, un seul partenaire de lancement a accès aux capacités d’analyse d’images de GPT-4 : l’application Be My Eyes pour malvoyants.

« Il y a des questions de politique et légales autour de la reconnaissance faciale par exemple et sur la façon de traiter les images de personnes également. Nous devons déterminer où se trouvent les zones de danger, les lignes rouges, et les clarifier » avant d’en ouvrir l’accès à un large public, explique l’éditeur.

Vous l’aurez compris, l’aventure GPT-4 ne fait que démarrer. Certaines de ses capacités sont assez spectaculaires. OpenAI met toutefois en garde contre cet effet « Whaouu » qui s’estompe avec le temps alors que les utilisateurs prennent conscience des limites et imperfections des IA actuelles. Néanmoins en grand frère plus mature et plus précis de ChatGPT, GPT-4 n’a pas fini de nous étonner et de trouver une place dans le quotidien des entreprises. Il sera en cela bien aidé par Microsoft qui insuffle les facultés génératives de GPT-4 au cœur de Dynamics 365 et Microsoft 365


À LIRE AUSSI :

Dans l'actualité

Verified by MonsterInsights