Data / IA
Mistral AI : De nouveaux services pour les entreprises et une troisième grosse levée
Par Laurent Delattre, publié le 12 juin 2024
Mistral AI réalise sa troisième levée en 1 an d’existence et se retrouve déjà valorisée à plus de 6 milliards d’euros. Parallèlement, la startup lance de nouveaux outils pour permettre aux entreprises de personnaliser ses modèles.
Par un message plutôt laconique et discret, Mistral AI a annoncé cette semaine avoir bouclé un troisième tour de table en un an d’existence et avoir levé 600 millions d’euros qui porte désormais sa valorisation à 6 milliards d’euros. Pas mal pour une jeune pousse née il y a à peine 12 mois.
Dès lors, on pourra s’étonner de voir la startup rester finalement très sobre dans sa communication autour de cette troisième levée de fonds alors que les précédentes levées avaient été ultramédiatisées et que son nouveau concurrent français, la startup H, a fait tout un battage à VivaTech autour de sa levée de 220 millions d’euros.
Pourquoi une telle discrétion ? Une actualité troublée par les contextes politiques, une demande des investisseurs, une levée jugée trop normale et logique pour justifier d’en faire médiatiquement des tonnes ou une volonté de rester sous le radar pour ne pas avoir à trop dévoiler de sa stratégie et des investissements à venir ?
1 milliard d’euros levés en 1 an
Ce tour de table a été mené par General Catalyst avec une vingtaine d’autres investisseurs dont les partenaires français d’origine (Bpifrance, BNP Paribas, Eurazeo…) et ceux de la précédente levée (LightSpeed, Andreessen Horowitz, etc.). On notera que si NVidia, Salesforce et IBM sont toujours listées sur cette levée, ce n’est pas le cas de Microsoft (qui a investit 15 millions d’euros dans Mistral AI en début d’année). On notera au passage que les trois fondateurs français conservent malgré tout le contrôle de leur entreprise.
Au total, en un an, la startup phare de l’IA en France a donc réussi à lever 1 milliard d’euros. C’est à la fois beaucoup pour une startup européenne et bien peu comparaison des 13 milliards de dollars obtenus par OpenAI auprès de Microsoft, des 7,3 milliards levés par Anthropic et des 6 milliards très récemment levés par Elon Musk pour sa nouvelle startup xAI.
La capacité de la jeune pousse française à créer des grands modèles fondation tenant tête à ceux d’OpenAI, Google et Anthropic est ce qui séduit ses investisseurs. Car avec seulement 60 employés dans le monde et un budget très inférieur, Mistral AI tient tête aux leaders américains. Son efficacité opérationnelle surprend. Selon les propos de Arthur Mensch rapportés par le Financial Times, Mistral AI n’aurait jusqu’ici dépensé que deux douzaines de millions de dollars pour entraîner ses modèles actuels et n’utiliserait qu’un millier de GPU NVidia (là où OpenAI, Meta ou Microsoft en exploite des dizaines voire des centaines de milliers).
1 milliard pour assoir un leadership
En l’absence de détails, difficile de prédire à quoi serviront les millions d’euros nouvellement levés. Bien évidemment, la startup veut assoir sa position à l’international et ne pas se laisser distancer par les Américains. Elle va donc devoir, elle aussi, investir dans des modèles encore plus puissants et multimodaux, donc plus coûteux à entraîner et à inférer.
En un an d’existence, Mistral AI a su imposer dans le paysage ses modèles open-source (Mistral 7B, Mixtral 8x7B, Codestral 22B) qui tiennent la dragée haute à ceux de Meta (Llama 2 et 3, Code Llama, etc.). Très populaires, ces modèles « fondation » sont proposés sur toutes les offres IA comme le portail Hugging Face, AWS BedRock, Google VertexAI, Microsoft Azure AI, etc.
Des offres entreprises qui gagnent en carrure
Parallèlement, Mistral AI gonfle son offre à destination des entreprises. L’éditeur a lancé en février son service conversationnel concurrent de ChatGPT, « Le Chat », ainsi que ses premiers modèles commerciaux Mistral Large et Mistral Small disponibles sur sa propre plateforme de Model-as-a-Service, dénommée « La Plateforme », ainsi que sur les clouds Azure et AWS.
Cette semaine, Mistral AI a lancé différents outils pour permettre aux entreprises et à leurs data-scientists de personnaliser ses modèles fondation.
Tout d’abord, Mistral AI propose un SDK en open-source pour personnaliser son modèle Mistral 7B grâce à des mécanismes de « fine-tuning » inspirés des mécanismes d’apprentissage LoRA. Ce SDK s’adresse à toutes les entreprises en quête de modèles personnalisables et personnalisés à affiner et inférer localement dans leurs datacenters. L’idée consiste pour les clients à s’approprier le modèle open source Mistral 7B et de l’entraîner un peu plus sur les ensembles de données propres à l’entreprises pour l’enrichir plus contextuellement. Ce « réentraînement » s’appuie ici sur une méthode d’adaptation de rang faible (Low Rank Adaptation) plus connue sous l’acronyme LoRA, réputée comme étant l’une des méthodes d’affinement des modèles les plus efficaces et les moins consommatrices de ressources (notamment mémoire).
Ensuite, Mistral AI propose également des services de fine-tuning sur sa propre plateforme serverless « La Plateforme ». Au travers de nouvelles API très simples d’emploi, le service permet aux entreprises de personnaliser les modèles Mistral 7B et Mistral Small en les affinant à l’aide de jeux de données qui leur sont propres. Il en résulte de nouveaux modèles « fine-tunés » autrement dit optimisés pour les usages envisagés et les besoins propres à l’entreprise.
Enfin, parce que les entreprises manquent souvent de compétences internes pour réaliser de tels affinements/ajustements de modèles, Mistral AI lance des services de formation sur mesure pour former de futurs spécialistes de la personnalisation des modèles fondation et accompagner les entreprises dans leurs projets de création de modèles hautement spécialisés pour leurs métiers. « Ces services de formation personnalisée sont disponibles pour un groupe restreint de clients et sont adaptés pour répondre à leurs besoins spécifiques » explique la startup.
Il est évidemment très encourageant de voir cette jeune pousse non seulement proposer des modèles LLM de grande qualité (bien meilleur que ChatGPT dans les subtilités linguistiques du français ou de l’allemand par exemple) mais aussi proposer autant de services aux entreprises en si peu de temps. Elle aura néanmoins bien besoin de sa troisième levée de fonds pour résister aux évolutions des modèles open-source de Meta (LLama) ou Microsoft (Phi), ainsi qu’à la course à l’AGI à laquelle se livrent OpenAI (ChatGPT, GPT-4o, GPT5), Google (Gemini) et Anthropic (Claude.ai).
A Mistral AI de démontrer qu’elle a toutes les qualités pour continuer de surprendre les experts et séduire les entreprises.
À LIRE AUSSI :
À LIRE AUSSI :