Cloud
Computex 2024 : les principales annonces Datacenters d’Intel, AMD et NVidia
Par Laurent Delattre, publié le 17 juin 2024
Traditionnellement, le salon Computex est plutôt un salon de PC de gaming et de machines portables toujours plus ultra-nomades. Mais cette année, la pression sur les besoins de l’IA a encouragé les acteurs à quelques grandes annonces autour des CPU et GPU qui vont animer serveurs et datacenters à l’avenir.
Le salon Computex, qui s’est tenu la semaine dernière, n’est pas qu’une opportunité de découvrir en avant-première les PC de la fin de l’année. C’est aussi l’occasion pour les fabricants de processeurs de faire quelques annonces et pas seulement dans l’univers du “Copilot+ PC“. La course à l’IA oblige, Intel, AMD et NVidia avait beaucoup de choses à raconter autour de leurs offres pour Datacenters.
Voici ce qu’il faut retenir de ces annonces…
Intel commence à livrer ses Xeon 6 et ses Gaudi 3
2024 s’annonce une année charnière pour les Xeon d’Intel. Le fondeur sépare sa gamme en deux familles et 4 séries ! Dit autrement, Intel essaye de mettre un peu de classement dans ses SKU sans chercher nécessairement à en diminuer le nombre. Il va falloir suivre, ce n’est pas simple. Grosso modo, la gamme Xeon 6 – gravée en technologie Intel 3 – se compose de deux familles :
– les « Sierra Forrest », des Xeon 6 économes en énergie et uniquement construit autour de « E-Cores », donc de cœurs efficients.
– les « Granite Rapids », des Xeon 6 pensés pour la performance, l’entraînement IA et le calcul scientifiques, uniquement dotés de « P-Cores » donc de cœurs « Performance ».
Chacune de ses deux familles se divisent en deux séries : les séries « 6700 » à alimentation raisonnable et les séries « 6900 » alimentées en 500W.
À Computex, Intel a annoncé le début des livraisons des « 6700E », autrement dit des « Xeon 6 Sierra Forrest » en TDP classique. Les modèles varient de 64 cœurs-e (avec un TDP 205W) à 144 cœurs-e (avec un TDP de 330 W) !
Intel a également annoncé pour Q3 2024 la livraison de ses surpuissants Xeon 6 « 6900P ». Autant pour ses économes « Sierra Forrest », Intel a donné la priorité à la série « 6700 », autant pour ses puissants « Granite Rapids », Intel veut tout de suite frapper dans le lourd avec les « 6900P » et leurs 128 « P-Cores ». Un processeur essentiellement destiné aux HPC et aux hyperscalers.
Il faudra en revanche attendre 2025 pour voir arriver les « Xeon 6 6900E » (les versions dopées à 500 W des Sierra Forrest) avec un modèle embarquant 288 cœurs ainsi que les versions moins gourmandes des Granite Rapids (avec les séries 6700P et la série Workstation 6300P).
Par ailleurs, Intel a confirmé à Computex que son nouveau GPU accélérateur IA « Gaudi 3 » était toujours sur les bons rails et que les premiers clients étaient en cours de livraison.
Selon Intel, les temps d’apprentissage en Gaudi 3 sont 40% plus rapides que ceux du NVidia H100 lors de la formation d’un grand modèle de langage (LLM) tel que GPT 3.5, qui comprend 175 milliards de paramètres. Des améliorations encore plus importantes ont été constatées sur LLama 2 avec 8 milliards de paramètres. En matière d’inférence, le Gaudi 3 d’Intel offre 170% des performances du H100 sur LLama 2 et est quatre fois plus rapide pour l’inférence d’un modèle comme Falcon 180B. De plus, le Gaudi 3 est considérablement plus économe en énergie que les GPU de NVidia : il se montrerait deux fois plus efficient que le H100 en général. Il est aussi 40% moins cher.
AMD passe au Zen 5
La génération de cœurs Zen 5 arrive chez AMD, aussi bien dans la gamme Ryzen avec des Ryzen 300 Series pour Copilot+ PC dotés d’un NPU 50 TOPS que dans la gamme « Datacenter » avec les nouveaux processeurs EPYC « Turin ». Ces derniers sont des processeurs gravés en 3 nm et constituent la cinquième génération des processeurs Epyc pour serveurs. Ils ne seront pas disponibles avant le quatrième trimestre 2024 mais AMD a dévoilé au Computex 2024 le nouveau fleuron de la gamme « Turin » : un processeur 192 cœurs (384 Threads) ! De quoi promettre une densité de calcul encore jamais vue.
Selon AMD, un processeur « Turin » en version 128 cœurs se montre 3,1 fois plus rapide qu’un Xeon 5 (en 64 cœurs) pour des traitements classiques et jusqu’à 5,4 fois plus rapide pour les inférences IA.
Par ailleurs, AMD a complété sa roadmap de GPU accélérateurs d’IA. À la fin de l’année dernière, AMD avait inauguré ses nouveaux GPU AMD Instinct MI300X.
Cette année, une nouvelle évolution dénommée MI325X va faire son apparition en fin d’année 2024 pour offrir de la mémoire HBM3E de sorte à fournir une bande passante de 6 To/sec et jusqu’à 288 Go de mémoire embarquée. Dès lors, AMD annonce que les MI325X (toujours en architecture CDNA 3) seront en moyenne 1,3 fois plus performante que les GPU « H200 » d’Intel.
AMD a également dévoilé la sortie en 2025 des GPU MI350 à architecture CDNA 4 « pour prendre le leadership en calcul et en mémoire » et la sortie en 2026 des MI400 basés sur une toute nouvelle architecture CDNA-Next.
NVidia ne s’en laisse pas compter
Évidemment, NVidia ne pouvait laisser ses concurrents fanfaronner sans réagir. Le concepteur de puces a déjà dévoilé en début d’année sa très prometteuse (mais onéreuse) génération de GPU « Blackwell » qui doivent être livrés au cours du second semestre 2024.
Blackwell promet 30 fois plus de performance en inférence et 25 fois moins d’énergie consommée que l’actuelle génération Hopper (H100, H200).
Et NVidia a déjà annoncé une nouvelle génération « Blackwell Ultra » en 2025 qui « repoussera les limites ».
Suivra en 2026 une nouvelle architecture de GPU, dénommée « Rubin », basée sur de la mémoire HBM4.
Parallèlement, NVidia devrait en 2026 dévoiler sa seconde génération de processeurs ARM pour remplacer les « Grace » qui équipent les solutions « CPU+GPU » GH100 actuelles et les futures GB200. Cette nouvelle génération de processeurs ARM se dénommera « Vera ».
NVidia se préoccupe également des réseaux saturés par les montagnes de données exigées par les IA et annonce un switch Spectrum Ultra X800 pour 2025 (800 Gbps en Ethernet) ainsi qu’un switch NVLink 6 en 2026 atteignant les 3600 GBps.
À LIRE AUSSI :
À LIRE AUSSI :