IBM lance son nouveau mainframe taillé pour l'ère de l'IA, le z17 à base de processeurs Telum II.

Data / IA

Z17, l’ambition renouvelée d’IBM pour le mainframe à l’ère de l’IA

Par Thierry Derouet, publié le 09 avril 2025

Malgré son image de « belle endormie », le mainframe fait son grand retour avec le z17, selon IBM. Entre modernisation du COBOL, intégration de l’IA et résilience accrue, IBM veut placer cette nouvelle mouture au cœur d’une informatique « mission-critical », prête pour l’ère de l’IA générative.

Hier, à Paris, un soleil printanier illuminait les toits et semblait annoncer une renaissance technologique. Loin d’être confiné dans un quelconque campus feutré, IBM présentait pourtant sa nouvelle génération de mainframes — le z17 — comme l’incarnation d’un renouveau bien réel : celui d’une informatique résiliente, conjuguant IA embarquée, ouverture sur le cloud et gestion agile du patrimoine applicatif.

Une annonce « plateforme », fruit d’un dialogue entre matériel et logiciel

« Nous réunissons à la fois le hardware et le software sur la même entité zStack », insiste d’emblée Catherine Chauvois, la directrice de la plateforme zStack au sein d’IBM France, rappelant que la force d’IBM a longtemps résidé dans cette approche intégrée. Le z17 se veut d’abord une « annonce plateforme ». Certes, IBM annonce une progression matérielle significative : « +11 % de performance processeur, -15 % de consommation électrique et -20 % d’empreinte carbone, par rapport à la génération précédente z16 », résume-t-elle. Mais la véritable nouveauté serait l’intégration, plus poussée que jamais, de l’inférence IA au cœur même de la puce.

Le z17 c’est +11 % de performance processeur, -15 % de consommation électrique et -20 % d’empreinte carbone, par rapport à la génération précédente z16 selon IBM.

« Le nouveau processeur IBM Telum II a été conçu pour embarquer un accélérateur IA, offrant jusqu’à 450 milliards d’inférences par jour (avec un temps de réponse de moins de 1ms, soit du temps réel), sur des transactions critiques », détaille Guillaume Wazner, leader technique de la plateforme zStack, qui rappelle que cette capacité existait déjà sur la génération précédente, mais qu’elle est aujourd’hui « améliorée et mutualisée » (le z16 réalisait 300 milliards d’inférences antifraude par jour sur les transactions). Les 208 processeurs du z17 se partagent ainsi plusieurs accélérateurs IA, assurant une exécution fluide des algorithmes de machine learning et de deep learning. D’après IBM, c’est l’aboutissement de cinq années de R&D et de plus de 300 dépôts de brevet.

70 % des transactions mondiales, mais seulement 8 % des dépenses

Pour celles et ceux qui douteraient de la place du mainframe dans les SI, un rappel s’impose. « Le mainframe, c’est 70 % des transactions mondiales, mais seulement 8 % des dépenses IT mondiales », lance Catherine Chauvois, en guise de chiffre choc. L’image d’un dinosaure s’effrite dès lors que l’on considère ces volumes : la banque et l’assurance demeurent, et de loin, le plus gros bassin d’utilisateurs mainframe. « C’est logique : transactions à haute dose, sécurité, résilience quasi-inégalée », argue la directrice de la plateforme zStack.

Les chiffres internes d’IBM suggèrent aussi que cette « vieille » technologie n’est pas si vieillissante. « Sur les dix dernières années, on a fait un x3 en capacité de traitement MIPS vendus, précise-t-elle, et même en troisième année de cycle, le z16 a continué de croître ». Du côté d’IBM, on attribue ce succès continu à deux facteurs : l’irremplaçable solidité du mainframe dans les environnements critiques d’un côté, et le regain de prudence provoqué par la crise sanitaire et la hausse des cyberattaques de l’autre. « Depuis le Covid, on observe un recentrage sur le mainframe pour les transactions critiques, confirme Catherine Chauvois. Les clients jouent désormais l’hybridation plutôt que l’abandon complet. »

Avec le z17, plus de 450 milliards d’inférences IA

Dans cette nouvelle génération, IBM met l’accent sur l’IA « au plus proche de la donnée ». « Le véritable enjeu, c’est de réaliser l’inférence en temps réel, au moment même où la transaction est traitée. », explique Guillaume Wazner, insistant sur la capacité du z17 à accélérer l’IA transactionnelle, notamment dans la lutte contre la fraude bancaire : « Les paiements se font en millisecondes ; inutile de déporter la détection de fraude en dehors, on perdrait un temps précieux. »

Ce calcul local, autrefois rare et coûteux, se justifie désormais par des cas d’usages multiples : détection de blanchiment, évaluation de risque climatique pour l’assurance, reconnaissance d’images médicales, ou encore chatbot conversationnel. « On parle ici d’IA générative, avec en perspective la carte Spyre, qui sera disponible en fin d’année 2025, et qui offrira une puissance équivalente à des GPU, mais avec une consommation 4 fois inférieure », renchérit Guillaume Wazner. Pour IBM, l’intelligence artificielle devient alors un véritable prolongement du système d’exploitation z/OS, qui s’apprête à passer en version 3.2, incluant un support NoSQL et des outils d’hybridation.

« L’IA, ça va jusqu’à la maintenance du code COBOL, sourit encore Catherine Chauvois, faisant allusion à Watsonx Code Assistant for Z, un outil qui s’appuie sur les modèles Granite d’IBM pour analyser, expliquer, voire convertir le COBOL en Java. Si un client a 40 ans de patrimoine applicatif, il ne va pas le réécrire du jour au lendemain. Il a besoin de l’exploiter, de le comprendre, et de le modulariser. »

COBOL, dette technique ou héritage à moderniser ?

Au fil de la discussion, il apparaît clairement que le z17 tente de soigner son image de « bastion du COBOL ». « Les entreprises ont souvent perdu la maîtrise de leur code, reconnaît Guillaume Wazner, mais le but, c’est de le refactoriser, de l’exposer en microservices, pas de tout réécrire. » Le mainframe deviendrait alors un composant agile dans les pipelines DevOps, prenant en charge Git, VS Code, ou encore Terraform.

« On vient casser le mythe du COBOL isolé, résume Catherine Chauvois. Avec les API REST, vous pouvez exposer vos transactions mainframe à n’importe quel cloud, tout en gardant la robustesse du ”z”. » Un discours qui résonne avec le fameux adage « fit for purpose » : à chaque workload, la plateforme la plus adaptée. « Si on veut déporter du front office sur un cloud public, libre à nous ; si on veut rapatrier des workloads critiques pour optimiser la latence et la sécurité, on le peut aussi. »

Les intervenants admettent toutefois un manque de main-d’œuvre sur le métier d’ingénieur système, plus encore que sur le COBOL. « Les compétences d’administrateur z/os sont rares, d’où la Z-Académie », mentionne Catherine Chauvois, évoquant un programme de reconversion mené avec France Travail, Landquest, et IBM, pour former des profils de tout horizon. « Nous avons vu des gens de 30 ou 40 ans totalement reconvertis, triplant parfois leur salaire. »

Sécurité, chiffrement post-quantique et résilience de l’IT

Si les métiers bénéficient d’un moteur IA pour la modernisation ou la détection de fraude, les équipes de production IT, elles, exigent de plus en plus de garanties en matière de cybersécurité. « La menace vient souvent de l’intérieur, rappelle Guillaume Wazner, qui cite la nouvelle fonction IBM Threat Detection for z/OS, un moteur UEBA (User and Entity Behavior Analytics) capable de sonner l’alarme au moindre comportement anormal dans la base de sécurité du mainframe ».

Au registre des innovations, IBM mentionne également le chiffrement quantum-safe : « Depuis le Z16, nous embarquons des algorithmes certifiés par le NIST, précise Catherine Chauvois. L’idée est de se prémunir contre les voleurs de données qui attendraient d’avoir la puissance quantique pour décrypter. » Pour ceux qui veulent aller plus loin, l’entreprise propose aussi l’encryption homomorphique partielle, qui permet de chiffrer la donnée au plus près du processeur.

« La sécurité et la résilience sont devenues un motif de réinvestissement majeur, notamment depuis les confinements et la multiplication des attaques ransomware, avance Catherine Chauvois, le mainframe incarne un “cœur de transaction” dont le temps de disponibilité, supérieur à 99,999 %, fait toujours la différence. »

IBM insiste par ailleurs sur le caractère hybride de cette sécurité : on peut désormais gérer ses clés de chiffrement via des solutions tierces standard, exposer des journaux d’événements dans des formats OpenTelemetry, et gérer le tout via un « tableau de bord » unifié, z Security and Compliance Center (ZSCC). « On rend compte de l’état de la conformité par rapport à la régulation DORA, on aide à la détection des anomalies, on remonte la bonne alerte au CIO, etc. »

Le cloud, un partenaire plutôt qu’un concurrent

Plusieurs DSI reprochent à IBM de se montrer peu disert sur des chiffres précis. « En France, nous ne communiquons pas de volumes spécifiques, confirme Catherine Chauvois. Mais nous savons que beaucoup de clients explorent l’hybridation : la partie critique reste sur z, tandis que certaines charges non critiques migrent sur le cloud. » Cela n’empêche pas certains acteurs de tenter l’aventure 100 % cloud, parfois à leurs dépens. « On a vu un client comme Santander s’essayer au “cloud-only.” Résultat : après trois ans et de gros investissements, il double ses coûts, parce qu’il doit maintenir le mainframe en parallèle. »

Pour Catherine Chauvois, la question n’est pas de tout basculer ni de tout conserver : « C’est du “fit for purpose,” la bonne plateforme pour la bonne charge. » Or, sur ce terrain, IBM se revendique « ouvert, » assumant l’idée d’« APIser » le mainframe pour le marier à OpenShift, Linux, Kubernetes, etc. « Les clients veulent une granularité et une volatilité de leurs applications, ajoute un analyste présent lors de cette présentation, et beaucoup, déçus par la hausse des coûts cloud, font marche arrière. »

L’importance de la conformité et de la traçabilité

« Depuis DORA ou NIS2, la pression sur les banques et assurances s’accentue, souligne Catherine Chauvois. Ils doivent prouver qu’ils maîtrisent leur patrimoine de données, qu’ils peuvent récupérer rapidement d’une corruption. » IBM propose ici un outil de « tour de contrôle » : Z Compliance Security Center, corrélé à l’IA, pour automatiser la remontée d’écarts et proposer des correctifs.

« On vit sur un continent en guerre, post-Covid. La confidentialité est un sujet de plus en plus sensible, souligne Catherine Chauvois, et le mainframe peut s’avérer un pilier solide en cas de crise. »
En retour, les régulateurs questionnent sans relâche les banques sur leurs capacités de reprise d’activité : « Comment réagir en cas de corruption de DB2 ? Quid des backups ? »
Sous z17, IBM se targue de pouvoir industrialiser la démarche : « Détection, alerte, rollback automatisé. »

z17: un retour au centre pour les DSI ?

Difficile de dire si la vague cloud qui a déferlé est en train de se retirer pour laisser la place au rapatriement massif de workloads critiques. Catherine Chauvois et Guillaume Wazner répètent cependant que le mouvement est enclenché : « La souveraineté, la sécurité, l’IA en temps réel : ce sont les moteurs qui poussent aujourd’hui à revoir la place du mainframe. » Et si, pour le DSI soucieux de rationaliser ses coûts et de renforcer son empreinte IA, « z » redevenait finalement une évidence ?


Sous le capot une machine de “dingue”

Le z17 reprend l’essentiel de l’architecture très particulière de son prédécesseur, le z16, architecture qui lui permet d’afficher une disponibilité de 99,999999% (soit 325 ms d’indisponibilité par an). Mais il s’en démarque par l’introduction d’un nouveau processeur, le Telum II dont les capacités étendues procurent au mainframe des capacités qui vont bien au-delà des tâches transactionnelles classiques pour lui ouvrir la porte de nouveaux workloads comme l’entraînement de modèles IA, l’inférence d’IA en temps réel sur des données de transaction, ou le chiffrement post-quantique des données les plus critiques.

Ce nouveau processeur Telum II permet par exemple d’appliquer 50% plus d’opérations d’inférence antifraude en temps réel sur les données transactionnelles que ne le permettait le z16. IBM annonce des performances IA de jusqu’à 24 milliards d’opérations par seconde avec une précision de données INT8 par puce.

Pour faciliter l’implémentation de l’IA dans les processus actuels, IBM a développé plus de 250 cas d’usage IA prêts à l’emploi, allant de l’analyse de fraudes à l’atténuation des risques de prêt, des chatbots à l’analyse d’images médicales, etc.

Et pour aller au-delà en matière d’IA et profiter des formidables capacités d’E/S de la machine (et donc de sa capacité à manipuler massivement de la data), le z17 peut accueillir des cartes PCIe accélératrices d’IA basées sur un nouveau NPU signé IBM et dénommé Spyre (qui reprend les technologies IA intégrées au Telum en les multipliant). IBM propose notamment des déclinaisons de ses modèles Granite spécialement optimisées pour Spyre et le z17.

Le z17 cherche à s’implanter plus aisément dans les chaînes CI/CD modernes.  Il fonctionne aussi bien sous Linux que sous z/OS 3.2. Cette dernière mouture de l’OS mainframe intègre l’accélération IA matérielle et des améliorations multiples, notamment au niveau de DB2 pour simplifier les scénarios hybrides, l’exploitation des données structurées et les fonctionnalités vectorielles nécessaires au RAG notamment.
IBM veut aussi aider les entreprises à unifier les opérations IT entre le mainframe et les autres infrastructures IT. IBM Z Operations Unite centralise les métriques de performance et logs provenant de multiples sources IBM Z au format OpenTelemetry. Cette solution accélère la détection d’anomalies, isole l’impact des incidents potentiels et réduit les temps de résolution. Utilisée avec IBM Concert, elle permet une corrélation intelligente des données opérationnelles à l’échelle de l’entreprise.

Du côté hardware, le z17 se compose de 4 armoires et embarque au total 4 racks CPC (Central Processor Complex) de calcul et 12 racks d’E/S (comportant chacun 16 slots).

Les tiroirs CPC forment ce qu’on appelait autrefois l’unité centrale. Ils embarquent les processeurs Telum II, la mémoire et les interconnexions à la fois avec les autres tiroirs CPC (pour le traitement SMP) et avec les tiroirs E/S. La fonctionnalité « Enhanced Processor Drawer Availability » permet le retrait et la réinstallation simultanés d’un tiroir CPC pour des mises à niveau ou des réparations dans les configurations à tiroirs multiples, améliorant ainsi la disponibilité globale du système.

Chaque tiroir CPC accueille 4 modules « DCM » hébergeant chacun 2 processeurs Telum II. Dit autrement, chaque tiroir CPC embarque en pratique 8 processeurs Telum II, soit 64 cœurs (cadencés à 5,5 GHz et capables d’exécuter jusqu’à 10 instructions par cycle d’horloge). Chaque tiroir CPC affiche ainsi une performance IA de 192 TOPS. Chaque tiroir CPC peut accueillir jusqu’à 16 To de mémoire.
Reste que la notion de « cœurs » n’existe en réalité pas chez IBM. Le constructeur parle plutôt de « PU », ou « Processor Unit », dont le fonctionnement et l’usage est défini par firmware. Et IBM réserve un certain nombre de « PU » à la gestion même du système et de la très haute disponibilité du z17 (avec, par exemple, des PU « Spare » réservés pour suppléer à d’éventuelles défaillances).
En d’autres termes, un z17 complet propose au maximum jusqu’à 208 « PU » accessibles (alors que la machine embarque physiquement 256 cœurs Tellum) et jusqu’à 64 To de RAM.

Quant aux tiroirs d’E/S, ils assurent la connectivité entre le système IBM z17 et les périphériques externes, les réseaux et les sous-systèmes de stockage. Ils jouent un rôle essentiel en hébergeant divers adaptateurs d’E/S qui prennent en charge différents protocoles et interfaces de communication, tels que FICON pour le stockage, OSA pour la mise en réseau et PCIe pour les E/S à usage général.
Sur le z17, ces tiroirs jouent également un autre rôle majeur en boostant les capacités IA du mainframe puisqu’ils accueillent les fameuses cartes PCIe « Spyre » accélératrices. Un z17 peut accueillir officiellement jusqu’à 48 cartes Spyre.

Un mot pour finir sur l’efficacité énergétique : Le z17 utilise 5,5 fois moins d’énergie que le z16 pour des tâches d’IA similaires.


Dans l'actualité

Verified by MonsterInsights