Green IT
Ce que le nouveau classement TOP500 nous apprend sur l’évolution des HPC
Par Laurent Delattre, publié le 21 novembre 2024
Le nouveau palmarès TOP500, qui classe les HPC les plus puissants de la planète, vient de sortir. Une fois n’est pas coutume, ce classement se révèle plein de chamboulements et donc plein d’enseignements, même pour les DSI. Déchiffrage…
Parce que les HPC, les supercalculateurs de la planète, ne poussent pas comme des champignons, prennent des années à être élaborés et justifient leur investissement sur la durée, les classements TOP500 (les 500 HPC les plus puissants de la planète) et GREEN500 (les 500 HPC les plus efficients de la planète) tendent à peu évoluer et à se ressembler d’une publication à l’autre.
Mais ce n’est pas le cas de cette 64 ème édition du TOP500, seconde publication de l’année 2024. Et ces chamboulements sont forcément porteurs de multiples informations quant à l’évolution de l’informatique et les usages des infrastructures IT les plus évoluées au monde.
Voici ce que les DSI doivent retenir de ce 64ème classement TOP500…
Les USA dominent le monde
Les États-Unis classent trois HPC aux trois premières places du classement. Bien sûr, cette première place n’est peut-être qu’une illusion, puisque la Chine refuse depuis quelques années de dévoiler les performances de ces HPC. Mais quand même…
L’exploit est d’autant plus marquant que les 3 systèmes sont tous des HPC exaflopiques et sont les seuls HPC exaflopiques de ce classement. L’Europe attend toujours que ses Jupiter et Jules Verne entrent en opération, ce pourrait bien ne pas intervenir avant 2026 (vu le retard pris par le développement du processeur Rhea-1 de SiPearl).
3 machines exaflopiques
Autre révélation de ce classement, les USA sont en avance sur leur planning. Alors que l’on s’attendait à voir ce classement dominé par l’Aurora, le second HPC exaflopique dont l’assemblage devait se terminer récemment, on découvre en tête du classement un « El Capitan » dont la finalisation n’était attendue que l’an prochain et dont l’assemblage est au final déjà suffisamment avancé pour lui permettre de prendre la tête du classement.
Le système El Capitan du Lawrence Livermore National Laboratory (LLNL), en Californie, aux États-Unis, est donc le nouveau système n°1 du TOP500, bien que sa construction ne soit pas totalement achevée. Basé sur une architecture HPE Cray EX255a, il a été « flashé » à 1,742 exaflops/s sur le benchmark HPL. El Capitan possède 11 039 616 cœurs et est basé sur des processeurs AMD EPYC de 4ᵉ génération avec 24 cœurs à 1,8 GHz et des accélérateurs AMD Instinct MI300A. Il utilise un système réseau Cray Slingshot 11 pour le transfert de données.
Surprise, Frontier est bien le nouveau numéro 2 de ce TOP500 alors qu’on y attendait plutôt l’Aurora. Ce système HPE Cray EX a été le premier HPC mondial à officiellement franchir la barre symbolique de l’exascale, soit 1 exaflop par seconde ou un milliard de milliards d’opérations par seconde (c’est un 1 suivi de 18 zéros). Il est installé au Oak Ridge National Laboratory (ORNL) dans le Tennessee, aux États-Unis, où il est exploité pour le Département de l’Énergie (DOE).
Le système a été mesuré à 1,353 exaflops/s en utilisant 9 066 176 cœurs, c’est mieux que lors du dernier classement (avec un score de 1,206 exaflops/s). Un score qui démontre que le Frontier peut encore évoluer (il ne disposait que de 8 699 904 cœurs lors du précédent classement) grâce à son architecture HPE Cray EX évolutive qui combine des CPU AMD EPYC™ de 3ᵉ génération optimisés pour le HPC et l’IA, avec des accélérateurs AMD Instinct™ 250X et une interconnexion Slingshot-11.
Aurora est un peu le perdant de cette 64ème édition. Il y a 6 mois, on le voyait déjà devenir n°1. Il n’atteint finalement que la troisième place avec un score HPL de 1,012 exaflops/s. Un score qui reste « préliminaire », car le système est en réalité toujours en phase d’assemblage, une mise en route opérationnelle qui semble avoir pris du retard. Il est installé à l’Argonne Leadership Computing Facility, dans l’Illinois, aux États-Unis, où il est également exploité pour le Département de l’Énergie (DOE). Ce nouveau système Intel est basé sur les lames de calcul exascale HPE Cray EX – Intel. Il utilise des processeurs Intel Xeon CPU Max Series, des accélérateurs Intel Data Center GPU Max Series et une interconnexion Slingshot-11. Il y a quand même une bonne nouvelle pour Aurora (et pour Intel) : La machine arrive en tête du nouveau benchmark HPL-MxP (anciennement HPL-AI) destiné à mesurer les performances en calculs en précision mixte afin de mieux faire ressortir les capacités IA des HPC. Il atteint désormais 11,6 exaflop/s devant le Frontier (et ses 11 exaflop/s) !
Le Fugaku est toujours là
Le HPC japonais Fugaku, qui a longtemps dominé le TOP500 avant l’arrivée des machines exascales figurent toujours dans le TOP en 6ème position.
Installé au RIKEN Center for Computational Science (R-CCS) à Kobe, au Japon, il possède 7 630 848 cœurs, ce qui lui a permis d’atteindre un score de benchmark HPL de 442 pétaflops/s.
Et s’il l’on fait ici un focus sur lui, c’est parce qu’il reste toujours le système le plus rapide sur le benchmark HPCG avec 16 téraflops/s !
En d’autres termes, malgré ses performances inférieures en calcul pur, le bon vieux HPC pré-exascale se révèle toujours le plus rapide sur des charges de travail très variées. En effet, le HPCG (High Performance Conjugate Gradients) est un benchmark complémentaire au bench HPL principal, conçu pour évaluer les performances des supercalculateurs en simulant des charges de travail plus représentatives des applications scientifiques réelles. Contrairement à HPL, qui se concentre sur la résolution de systèmes d’équations linéaires denses, HPCG met l’accent sur des opérations telles que la multiplication de matrices creuses, les mises à jour de vecteurs et les produits scalaires globaux. L’objectif principal de HPCG est de fournir une mesure complémentaire à HPL, en reflétant mieux les performances des systèmes HPC (High Performance Computing) sur des applications à accès mémoire irrégulier et à faible rapport calcul/déplacement de données.
Des HPC dans le Cloud
Pour OpenAI et ses autres clients de l’IA autant que pour sa propre division IA, Microsoft a construit un super calculateur dénommé « Eagle » et installé dans un des datacenters Azure.
Cette machine continue de figurer dans le TOP 5. Avec ses 2.073.600 cœurs de calcul (CPU et GPU combinés) procurés par ses processeurs Intel Xeon Platinum 8480C (à 48 cœurs) et ses GPU NVidia H100, l’Eagle affiche un score HPL de 561 Petaflop/s.
Azure place d’autres HPC dans ce Top 500 avec l’Explorer-WUS3 en 26ème position, le Reindeer en 32ème position, le Voyager-EUS2 en 42 ème position et les machines Pioneer (WUS2, WEU, EUS et SCUS) qui occupent les places entre la 81ème et 84ème position.
Azure reste le principal fournisseur de Cloud à participer au TOP500. AWS a bien une machine classée à la 120ème place et Google ne se livre pas à ce jeu. Dommage que Scaleway et OVHcloud ne s’essayent pas non plus à y faire figurer leurs gros clusters assemblés pour l’IA.
Des Européens en attente
Au chapitre des désillusions, force est de constater qu’il n’y a plus qu’une machine européenne dans le Top 5 et seulement 4 machines « EU » dans le TOP 10. Ce HPC européen du TOP 5 est un nouvel entrant. Et c’est une machine privée non financée par l’Europe et son consortium EuroHPC. Il s’agit du « HPC6 » de Eni, qui repose sur la même architecture que le El Capitan (mais avec des AMD Epyx de 3ème génération et des GPU AMD MI250X). La machine possède 3 143 520 cœurs (CPU + GPU) et atteint presque 478 Petaflop/s.
Au passage on notera qu’il n’y a aucune machine française dans le TOP 20 alors que l’Italie en possède 2 dans le Top 10. La France possède 24 HPC classés dans le TOP500 néanmoins.
Après avoir œuvré à multiplier les HPC ces dernières années, l’Europe met aujourd’hui toute son énergie, toute son attention et toutes ses finances dans la construction de ses deux premiers supercalculateurs exaflopiques : le Jupiter et le Jules Verne. Et son retour dans le Top 5 n’est pas attendu avant au mieux deux ans.
On peut être puissant et économe
Parallèlement au TOP500, un autre classement est publié qui ne prend pas seulement en compte la performance mais aussi la consommation électrique. Il en résulte un classement GREEN500 des HPC les plus efficients de la planète.
Les ordinateurs exascales étaient jusqu’ici plutôt bien classées dans le GREEN500. Mais ce n’est plus le cas. En l’occurrence, ce sont vraiment les HPC les plus récents qui trustent les premières places.
En effet, le « El Capitan » figure en 18 ème place (ce qui n’est pas si mal pour une machine qui doit alimenter plus de 11 000 000 cœurs), le « Frontier » se classe 22ème, alors que le « Aurora » doit se contenter de la 64ème place avec ses processeurs Intel.
Une nouvelle fois, le classement Green500 vient saluer l’efficience des processeurs AMD sur les processeurs Intel, mais plus encore l’efficience des architectures ARM.
En effet, si AMD anime 14 machines du Green25, contre seulement 3 pour Intel, NVidia vient bouleverser les classements Green500 avec ses superchips « Grace Hopper » GH200 à architecture ARM qui animent 7 des 25 systèmes les plus efficients mais surtout qui animent 4 des 7 machines les plus efficientes et les 2 systèmes les plus efficients au monde.
Les deux systèmes les plus hyper efficients qui sont… européens ! Le premier est particulièrement encourageant. Il s’agit du JEDI qui est un démonstrateur technique du futur « Booster Module » du futur HPC exascale européen JUPITER. Construit par ParTec et Eviden, le JEDI ne figure certes qu’à la 224 ème place du TOP500. Mais il affiche une efficience de 72,7 Gigaflops par Watt !
Le second système le plus efficient de la planète est le ROMEO-2025 de l’université de Reims Champagne Ardenne. Cette machine universitaire construite par Eviden se positionne à la 122 ème place du TOP500 avec ses 47.328 cœurs procurés par ses superchips NVidia GH200 à 72 cœurs. Elle offre une puissance de calcul de 9,86 Petaflop/s pour un score « efficience » de 71 Gigaflops par Watt !
D’autres enseignements du TOP500
Le total cumulé des HPC dépasse pour la première fois les 10 Exaflop/s pour atteindre 11,73 exaflop/s. Avec l’arrivée de nouvelles machines exascales dans les prochaines années, ce score sera rapidement dépassé.
Les HPC se multiplient sur la planète. Le nouveau TOP500 compte 53 nouvelles machines depuis Juin. Intel en anime 30, AMD en anime 20 et NVidia en anime 3 avec ses chips « Grace Hoper » à architecture ARM.
Les CPU Intel animent 62% des HPC du TOP500 contre 63% précédemment. Les CPU AMD animent 32,2% des machines du classement (soit 161 systèmes).
Les GPU animent de plus en plus de HPC. Ainsi, désormais, 211 des 500 HPC référencés sont animés par une combinaison de GPU et de CPU.
Sur les 53 nouvelles machines de ce classement, 39 sont animées par des GPU Nvidia alors que 7 sont équipées de GPU AMD.
Lenovo est le constructeur avec le plus de HPC classés (161 machines) devant HPE Cray (115 mchines) et le français Eviden (52 machines).
Retrouvez tout le classement TOP500 ici : TOP500 List – November 2024 | TOP500
Retrouvez tout le classement GREEN500 ici : Green500 List – November 2024 | TOP500
À LIRE AUSSI :
À LIRE AUSSI :
À LIRE AUSSI :
À LIRE AUSSI :