Thomas, Thomas, Thomas, c'est quoi DeepSeek et tout le ramdam qui l'accompagne ?

Data / IA

Short S2E24 – DeepSeek, l’IA chinoise qui fait trembler les États-Unis

Par Alessandro Ciolek, publié le 29 janvier 2025

Le petit monde de la Tech et de l’IA est secoué cette semaine par le lancement d’un nouveau modèle à raisonnement, ouvert, « DeepSeek R1 » qui rivalise avec les meilleurs modèles frontières américains à commencer par « OpenAI o1 ». Fruit d’un travail d’optimisation intense, il aurait surtout été infiniment moins coûteux à créer et serait 30 fois moins onéreux à inférer. De quoi interroger tous les chercheurs IA occidentaux, inquiéter les investisseurs et affoler les politiques américains… Décryptage…

Le modèle DeepSeek R1, développé par la startup chinoise DeepSeek, suscite, depuis sa sortie il y a une semaine, un vif débat aux États-Unis en raison de ses implications techniques, économiques et géopolitiques.
Car ce grand modèle (671 milliards de paramètres) est à la fois très inscrit dans l’air du temps (c’est un modèle à raisonnement dans la lignée d’OpenAI o1) mais aussi très disruptif par sa publication en « open source » et les tarifs pratiqués en inférence par DeepSeek qui sont 27 fois inférieurs à ceux affichés par OpenAI !

Pire encore, alors que les Américains (Microsoft, Oracle, Meta, Google…) investissent des milliards de dollars pour créer des datacenters IA dotés des toutes dernières technologies pour entraîner leurs IA, DeepSeek — société chinoise, donc handicapée par les restrictions américaines sur les puces et les technologies avancées — se serait contenté d’un petit cluster de 2048 GPU d’ancienne génération (les Nvidia H800, version légèrement bridée du populaire H100). Et son apprentissage n’aurait coûté « que » 6 millions de dollars (loin des 100 millions de dollars dépensés dans l’apprentissage des grands modèles américains).

Bien sûr, de nombreuses zones d’ombre entourent la réalité des chiffres affichés par la startup (les chiffres ne comprennent ni les coûts de préparation de données, ni les coûts de R&D, ni les coûts d’utilisation d’autres modèles IA exploités pour l’apprentissage par renforcement) mais ces révélations remettent en question les investissements massifs des géants américains et soulèvent des doutes sur leur rentabilité future. L’annonce de DeepSeek R1 a ainsi entraîné une chute historique des actions de Nvidia et d’autres géants de la Tech, effaçant près de 600 milliards de dollars de valorisation en une journée, les investisseurs craignant que l’efficacité des modèles chinois ne rende obsolètes les infrastructures coûteuses.

Le succès de DeepSeek R1 — et de l’application de tchat qui l’accompagne (plus de 3 millions de downloads en 1 semaine) — est perçu outre-Atlantique comme un « moment Spoutnik » pour l’IA, symbolisant la montée en puissance de la Chine malgré les sanctions US. Il met à mal l’idée de la supériorité américaine basée sur l’accès exclusif aux technologies de pointe.

DeepSeek R1 est surtout considéré comme une immense victoire pour l’intelligence artificielle open source. Certes, DeepSeek R1 n’est pas un modèle pur open source selon la définition OSI, mais c’est un modèle « ouvert » (open weight) publié sous la très permissive licence MIT. Et cette publication « ouverte » du modèle menace un peu plus l’hégémonie des modèles propriétaires américains d’OpenAI, ClaudeAI et Google. Yann LeCun, patron de la R&D IA chez Meta, s’est d’ailleurs ouvertement réjoui de ce lancement réussi, même si DeepSeek R1 taille des croupières à son LLama 3.3 sur les benchmarks : « Le succès de DeepSeek, qui a grandement bénéficié de la recherche ouverte et de l’open source, est la preuve de la supériorité des modèles open source sur les modèles propriétaires. Aujourd’hui, tout le monde peut profiter de leur travail ». Sous-entendu, tous les chercheurs en IA vont pouvoir exploiter les travaux de DeepSeek pour, à leur tour implémenter, les optimisations spectaculaires mises en œuvre par les chercheurs chinois.

Quoi qu’il en soit, la sortie de DeepSeek R1 a déclenché outre-Atlantique une explosive crise de confiance dans la supériorité technologique américaine et une prise de conscience des nouveaux paradigmes de l’IA. Au passage, la Chine aura une nouvelle fois démontré sa capacité à innover sous contraintes. L’Europe devrait s’en inspirer pour venir secouer elle aussi l’écosystème de l’IA. Apparemment, c’est encore possible ! Et c’est probablement là le principal enseignement de DeepSeek R1 !

À LIRE AUSSI :

Data / IA

Les modèles à raisonnement : la nouvelle frontière de l’IA

Laurent Delattre

23 Jan

À LIRE AUSSI :

Newtech

Short S2E22 – L’euro numérique : une monnaie digitale dès 2025 ?

Alessandro Ciolek

12 Jan

À LIRE AUSSI :

Data / IA

Short S2E20 – IA : une collecte de données plus en plus restreinte

Alessandro Ciolek

13 Nov

Restauration et détection automatisées : Cohesity poursuit son partenariat avec Microsoft

Frédéric Bergonzoli

12 Déc
IA en cybersécurité : qui mène vraiment le jeu ?

Laurent Delattre

12 Déc
L’adoption de l’IA en entreprise accélère encore et toujours

Laurent Delattre

12 Déc
PDF et e-signature : Nitro mise sur Climb pour accélérer son développement européen

Frédéric Bergonzoli

12 Déc
GPT-5.2 est déjà là… et c’est du lourd !

Laurent Delattre

12 Déc
Trophées de la Femme Cyber 2025 : le CEFCYS met en lumière 18 talents féminins de la cyber

Thierry Derouet

11 Déc
NetApp harmonise le stockage défragmenté

Vincent Verhaeghe

11 Déc
Orange valide ses contenus marketing grâce à l’IA générative

Thierry Lévy-Abégnoli

11 Déc
Maîtriser la navigation de drones dans les conduits d’aération

Charlotte Mauger

11 Déc
Capgemini TechnoVision 2026 : l’IA force les DSI à reconstruire leur SI

Marie Varandat

10 Déc

Short S2E24 – DeepSeek, l’IA chinoise qui fait trembler les États-Unis

Abonnez-vous à la newsletter hebdo d'IT for Business !

Nous vous envoyons un e-mail de validation !

Dans l'actualité

Restauration et détection automatisées : Cohesity poursuit son partenariat avec Microsoft

IA en cybersécurité : qui mène vraiment le jeu ?

L’adoption de l’IA en entreprise accélère encore et toujours

PDF et e-signature : Nitro mise sur Climb pour accélérer son développement européen

GPT-5.2 est déjà là… et c’est du lourd !

Trophées de la Femme Cyber 2025 : le CEFCYS met en lumière 18 talents féminins de la cyber

NetApp harmonise le stockage défragmenté

Orange valide ses contenus marketing grâce à l’IA générative

Maîtriser la navigation de drones dans les conduits d’aération

Capgemini TechnoVision 2026 : l’IA force les DSI à reconstruire leur SI

Short S2E24 – DeepSeek, l’IA chinoise qui fait trembler les États-Unis

Abonnez-vous à la newsletter hebdo d'IT for Business !

Nous vous envoyons un e-mail de validation !

Dans l'actualité

Restauration et détection automatisées : Cohesity poursuit son partenariat avec Microsoft

IA en cybersécurité : qui mène vraiment le jeu ?

L’adoption de l’IA en entreprise accélère encore et toujours

PDF et e-signature : Nitro mise sur Climb pour accélérer son développement européen

GPT-5.2 est déjà là… et c’est du lourd !

Trophées de la Femme Cyber 2025 : le CEFCYS met en lumière 18 talents féminins de la cyber

NetApp harmonise le stockage défragmenté

Orange valide ses contenus marketing grâce à l’IA générative

Maîtriser la navigation de drones dans les conduits d’aération

Capgemini TechnoVision 2026 : l’IA force les DSI à reconstruire leur SI

Abonnement GRATUIT

Accès à Albert (ChatGPT for IT)

Contenus réservés à la communauté d’IT for Business

La newsletter hebdo d’IT for Business

Des invitations privilégiées à nos événements