Thomas, Thomas, Thomas, c'est quoi DeepSeek et tout le ramdam qui l'accompagne ?

Data / IA

Short S2E24 – DeepSeek, l’IA chinoise qui fait trembler les États-Unis

Par Alessandro Ciolek, publié le 29 janvier 2025

Le petit monde de la Tech et de l’IA est secoué cette semaine par le lancement d’un nouveau modèle à raisonnement, ouvert, « DeepSeek R1 » qui rivalise avec les meilleurs modèles frontières américains à commencer par « OpenAI o1 ». Fruit d’un travail d’optimisation intense, il aurait surtout été infiniment moins coûteux à créer et serait 30 fois moins onéreux à inférer. De quoi interroger tous les chercheurs IA occidentaux, inquiéter les investisseurs et affoler les politiques américains… Décryptage…

YouTube

En chargeant cette vidéo, vous acceptez la politique de confidentialité de YouTube.
En savoir plus

Charger la vidéo

Le modèle DeepSeek R1, développé par la startup chinoise DeepSeek, suscite, depuis sa sortie il y a une semaine, un vif débat aux États-Unis en raison de ses implications techniques, économiques et géopolitiques.
Car ce grand modèle (671 milliards de paramètres) est à la fois très inscrit dans l’air du temps (c’est un modèle à raisonnement dans la lignée d’OpenAI o1) mais aussi très disruptif par sa publication en “open source” et les tarifs pratiqués en inférence par DeepSeek qui sont 27 fois inférieurs à ceux affichés par OpenAI !

Pire encore, alors que les Américains (Microsoft, Oracle, Meta, Google…) investissent des milliards de dollars pour créer des datacenters IA dotés des toutes dernières technologies pour entraîner leurs IA, DeepSeek — société chinoise, donc handicapée par les restrictions américaines sur les puces et les technologies avancées — se serait contenté d’un petit cluster de 2048 GPU d’ancienne génération (les Nvidia H800, version légèrement bridée du populaire H100). Et son apprentissage n’aurait coûté « que » 6 millions de dollars (loin des 100 millions de dollars dépensés dans l’apprentissage des grands modèles américains).

Bien sûr, de nombreuses zones d’ombre entourent la réalité des chiffres affichés par la startup (les chiffres ne comprennent ni les coûts de préparation de données, ni les coûts de R&D, ni les coûts d’utilisation d’autres modèles IA exploités pour l’apprentissage par renforcement) mais ces révélations remettent en question les investissements massifs des géants américains et soulèvent des doutes sur leur rentabilité future. L’annonce de DeepSeek R1 a ainsi entraîné une chute historique des actions de Nvidia et d’autres géants de la Tech, effaçant près de 600 milliards de dollars de valorisation en une journée, les investisseurs craignant que l’efficacité des modèles chinois ne rende obsolètes les infrastructures coûteuses.

Le succès de DeepSeek R1 — et de l’application de tchat qui l’accompagne (plus de 3 millions de downloads en 1 semaine) — est perçu outre-Atlantique comme un « moment Spoutnik » pour l’IA, symbolisant la montée en puissance de la Chine malgré les sanctions US. Il met à mal l’idée de la supériorité américaine basée sur l’accès exclusif aux technologies de pointe.

DeepSeek R1 est surtout considéré comme une immense victoire pour l’intelligence artificielle open source. Certes, DeepSeek R1 n’est pas un modèle pur open source selon la définition OSI, mais c’est un modèle « ouvert » (open weight) publié sous la très permissive licence MIT. Et cette publication « ouverte » du modèle menace un peu plus l’hégémonie des modèles propriétaires américains d’OpenAI, ClaudeAI et Google. Yann LeCun, patron de la R&D IA chez Meta, s’est d’ailleurs ouvertement réjoui de ce lancement réussi, même si DeepSeek R1 taille des croupières à son LLama 3.3 sur les benchmarks : « Le succès de DeepSeek, qui a grandement bénéficié de la recherche ouverte et de l’open source, est la preuve de la supériorité des modèles open source sur les modèles propriétaires. » Aujourd’hui, tout le monde peut profiter de leur travail ». Sous-entendu, tous les chercheurs en IA vont pouvoir exploiter les travaux de DeepSeek pour, à leur tour implémenter, les optimisations spectaculaires mises en œuvre par les chercheurs chinois.

Quoi qu’il en soit, la sortie de DeepSeek R1 a déclenché outre-Atlantique une explosive crise de confiance dans la supériorité technologique américaine et une prise de conscience des nouveaux paradigmes de l’IA. Au passage, la Chine aura une nouvelle fois démontré sa capacité à innover sous contraintes. L’Europe devrait s’en inspirer pour venir secouer elle aussi l’écosystème de l’IA. Apparemment, c’est encore possible ! Et c’est probablement là le principal enseignement de DeepSeek R1 !


À LIRE AUSSI :

À LIRE AUSSI :

À LIRE AUSSI :

Dans l'actualité

Verified by MonsterInsights