Cloud
Oracle CloudWorld 2023 : ce qu’il faut en retenir…
Par Laurent Delattre, publié le 05 octobre 2023
Sans surprise, la grand-messe annuelle d’Oracle Cloud aura été en 2023, comme toutes les autres conférences cloud de cette année, totalement phagocytée par un même sujet : l’IA générative. Voici ce qu’Oracle avait à dire sur ce sujet buzz de 2023 et ce qu’il faut aussi retenir de ce CloudWorld 2023.
La semaine dernière, Oracle tenait à Las Vegas son évènement CloudWorld 2023. L’occasion pour l’éditeur de montrer sa volonté de poursuivre sa progression dans le cloud en surfant sur la compétitivité de ses offres et l’envie des entreprises d’optimiser leurs coûts au travers d’approches multiclouds. Quitte à signer des partenariats aussi forts que surprenants pour mieux aider les entreprises à concrétiser leurs efforts multiclouds, des efforts qui sont les meilleures opportunités pour Oracle et son OCI (Oracle Cloud Infrastructure) de glaner des parts de marché. Preuve en est l’annonce du nouveau partenariat entre Oracle et Microsoft, avec l’offre « Oracle Database@Azure » lancée juste avant CloudWorld 2023, qui voit désormais les services de bases de données Oracle jusqu’ici uniquement disponibles sur OCI être également déployés sur Azure, via des serveurs Oracle Exadata et certaines couches OCI managés par Oracle, mais directement hébergés dans les datacenters Azure. Un partenariat qui permet à Oracle de conforter ses positions dans le cloud et au duo OCI/Azure d’afficher une offre originale qui se démarque pour mieux concurrencer AWS (et dans une moindre mesure Google Cloud).
À LIRE AUSSI :
Reste que 2023 n’est pas une année comme une autre. C’est l’année de l’éclosion de l’IA générative. Une technologie qui bouleverse notre perception de l’IA et ré-interroge nos sociétés sur l’avenir du travail alors qu’elles n’ont pas terminé de digérer les implications de la crise COVID sur ce même thème.
Pour tous les fournisseurs de services, il est fondamental de démontrer leur implication sur cette révolution technologique. L’IA générative a été le thème central de toutes les grandes conférences de l’année : Microsoft (Build, Inspire, …), Google (I/O, Next’23, …), Amazon, Salesforce, SAP, etc., tous ont focalisé leurs discours et leurs annonces sur l’IA générative.
Oracle ne pouvait pas demeurer en reste. « L’IA Générative est une révolution. C’est une percée fondamentale. C’est une transformation majeure… » a ainsi expliqué Larry Ellison, co-fondateur et CTO d’Oracle. « Elle change fondamentalement les choses chez Oracle. L’IA est centrale dans presque tout ce que nous faisons ».
Aussi, l’éditeur s’est-il évertué durant CloudWorld 2023 à démontrer qu’il existait dans le buzz médiatique et technologique du moment, parce que la Comm l’impose bien sûr, mais surtout parce que les entreprises sont en vraie demande aujourd’hui et parce que le futur n’attend pas. Et c’est logique. Pas d’IA sans data… Et les datas, notamment celles historiques si essentielles à l’apprentissage, sont pour beaucoup stockées dans des bases Oracle !
Voici ce qu’il faut retenir des principales annonces Oracle CloudWorld 2023 :
De la recherche vectorielle dans Oracle Database 23c
Quoi de mieux pour illustrer le propos précédent que l’annonce par Oracle de l’arrivée prochaine d’un moteur « AI Vector Search » dans Oracle Database 23c. Dit autrement, Oracle est en train d’intégrer une vraie recherche sémantique au cœur de sa base de données phare. Concrètement, cela se traduit par l’arrivée d’un nouveau type de données (vector data type), de nouveaux index vectoriels, et de nouveaux opérateurs SQL dédiés à la recherche vectorielle. Dès lors, une base Oracle pourra stocker, analyser et interpréter le contenu sémantique des documents, images, flux audios et autres données non structurées sous forme de vecteurs.
Pour rappel, les vecteurs jouent un rôle essentiel en IA. Ils permettent de représenter un texte ou une image pour les rendre manipulables par des algorithmes mathématiques ou statistiques. Grâce aux vecteurs, on peut mesurer la similarité de deux textes, ou de deux images, mais aussi appliquer des transformations pour les modifier ou les traduire.
Dit autrement, avec AI Vector Search, Oracle Database 23c (et sa version cloud managée Autonomous Database) est désormais capable de réaliser des recherches dans des images, d’exécuter des requêtes de suggestions de produits ou de similarité de descriptions.
À LIRE AUSSI :
Outre des capacités de recherche sémantique intégrées au cœur de la base, les fondations de AI Vector Search dans Database 23c doivent aussi permettre d’ajouter aisément dans les applications d’entreprise construites sur Oracle Database (et Autonomous Database) des interfaces en langage naturel s’appuyant sur les LLM (les grands modèles linguistiques).
Dans un même ordre d’idées, une telle fonctionnalité devrait aussi permettre aux entreprises de développer leurs propres mécanismes RAG (Retrieval augmented generation) permettant d’ajouter du contexte à un modèle fondation pré-entraîné (comme les LLM justement) afin de rendre ses réponses plus pertinentes.
Et des vecteurs pour MySQL HeatWave
Oracle a introduit un nouveau Vector Store à son service cloud d’analyse de données MySQL HeatWave (basé sur MySQL et l’enrichissant d’un moteur analytics), permettant aux entreprises de traiter plus efficacement leurs données. Cette fonctionnalité permet d’ingérer des documents dans divers formats et de les stocker sous forme d’« embeddings ». De quoi permettre et accélérer toutes sortes de requêtes IA autour des données non structurées. Outre Vector Store, MySQL HeatWave hérite au passage de nouvelles fonctionnalités d’IA générative à commencer par une interface pilotée par un LLM pour permettre aux utilisateurs d’interagir avec le service en langage naturel.
Oracle annonce également d’autres mises à jour à commencer par des améliorations apportées à AutoML et aux composants MySQL Autopilot, ainsi que le support pour JavaScript et une fonction d’ingestion en masse. Enfin, Oracle a renforcé sa collaboration avec AWS en ajoutant la capacité Lakehouse au service MySQL HeatWave sur AWS. Cela permet aux clients de mapper et d’interroger des téraoctets de données dans Amazon S3 sans encourir de frais de sortie.
Une API d’IA générative en partenariat fort avec Cohere
Oracle a également annoncé un nouveau service OCI d’IA générative s’appuyant notamment sur les LLMs de la startup Cohere (grand concurrent d’OpenAI et Anthropic). Ce service managé permet aux entreprises d’intégrer aisément des interfaces conversationnelles dans leurs applications métiers via une simple API. Cette API expose trois modèles fondation : Command, Summarize et Embed.
« Embed »
Ce modèle vectorise un texte fourni en paramètre et ceci dans une centaine de langues. Selon Oracle, ce modèle peut être employé dans une grande variété de cas d’usages : recherche sémantique, classification de texte, moteurs de recherche pour RAG, etc.
« Summarize »
Selon Oracle, ce modèle réalise un résumé abstrait d’un texte fourni en paramètre, mais en permettant à l’utilisateur/développeur de personnaliser les résultats à l’aide de nombreux paramètres. Autrement dit de spécialiser le modèle pour des cas d’usage bien définis : résumé de documents juridiques complexes, résumé de documentation d’assistance technique, résumé d’un long enchaînement d’emails pour les cadres dirigeants, etc.
« Command »
Modèle phare de Cohere, Command est un LLM disponible en deux tailles différentes (en fonction des contraintes de temps de réponse) qui accepte des requêtes en langage naturel et y répond avec élégance. Sa particularité est qu’il a été spécifiquement pensé dès le départ pour s’adapter aux données et contraintes de l’entreprise. Dit autrement, Command est hautement personnalisable afin de plier le LLM aux besoins métiers et aux cas d’usage bien définis de l’entreprise : génération de fiches produit, résumé de documentation, RAG, interfaces conversationnelles (chat), etc.
La quête d’usages IA spécialisés
La volonté d’Oracle derrière cette API générative développée avec Cohere est vraiment d’offrir des IA génératives forgées pour les besoins propres aux métiers ou à l’entreprise simples à exploiter. Pour Larry Ellison, ce que les entreprises veulent vraiment c’est « prendre ces nouveaux modèles IA génératifs, ces modèles ‘fondation’ standards, et les spécialiser pour le droit, pour la médecine ou pour un autre domaine. Ils veulent utiliser leurs propres données d’entraînement pour les spécialiser ».
Et pour Oracle, le meilleur moyen d’y arriver c’est de combiner les nouvelles capacités vectorielles de Database 23c avec OCI Generative AI Service.
De l’IA Générative partout dans Fusion Cloud
Ces services d’IA générative ne sont pas uniquement destinés à une consommation externe. Oracle les utilise pour insuffler de telles capacités sur à peu près toutes les composantes de ses suites « Fusion Cloud » : Cloud Customer Experience (CX), Human Capital Management (HCM), Enterprise Resource Planning (ERP), mais aussi Supply Chain Management (SCM) comptent ainsi parmi les premières suites « Fusion Cloud » à bénéficier d’une intégration des modèles précédemment évoqués pour accélérer et fluidifier les processus.
Oracle construit un supercalculateur avec NVidia…
Pour exécuter ces nouveaux services d’IA génératives, mais aussi les modèles développés ou personnalisés par les entreprises clientes d’OCI, Oracle veut ses propres supercalculateurs au travers d’un partenariat avec NVidia. Et Larry Ellison affiche ouvertement ses ambitions : « Nous construisons des superclusters de GPU NVidia et l’un d’eux sera le plus important supercalculateur scientifique jamais construit dans l’histoire de la Terre »… Rien que ça… Et pour le fondateur d’Oracle, cette puissance réside dans les solutions RDMA (transfert direct des données entre deux mémoires) mises en œuvre dans OCI et les infrastructures Exadata pour limiter les latences dans le traitement des données. « Si vous ne transférez pas les données assez rapidement, les processeurs attendent. Nous savons déplacer les données mieux que quiconque. Nous avons appris à maîtriser les technologies RDMA pour nos bases de données. C’est le même problème avec les clusters GPU. Nous l’avons résolu avec les bases de données et nous appliquons maintenant ce savoir-faire aux modèles IA » ajoute Larry Ellison.
Reste que, comme c’est devenu une tradition, nombre de ces nouveautés IA sont encore souvent en mode preview et même en mode preview privé. En outre, la tarification de toutes ces intelligences n’a pas vraiment été évoquée et reste à définir. Ce CloudWorld 2023 aura cependant démontré que l’éditeur ne se contente pas de suivre la vague IA. Il a aussi son propre agenda sur ce sujet et sait nouer les partenariats pour le concrétiser. Une façon de montrer que l’IA chez ses clients ne se fera pas sans lui…
De l’IA générative pour l’univers de la santé
On n’en parle pas souvent, mais Oracle pèse lourd sur le marché de la santé aux USA depuis le rachat de Cerner. Et ce secteur d’activité est on ne peut plus stratégique désormais pour le groupe. Au point que nombre d’annonces sur ce CloudWorld 2023 visaient spécifiquement les acteurs de la santé. Ainsi, Oracle a annoncé une série de mises à jour de ses suites Fusion Cloud ciblant spécialement les acteurs du « healthcare » : ERP, HCM, EPM et SCM embarquent des nouveautés spécialement pensées pour les hôpitaux et visant à améliorer et unifier les opérations et soins des patients. L’éditeur a même lancé Oracle Clinical Digital Assistant pour les fournisseurs de services de santé.
À LIRE AUSSI :
À LIRE AUSSI :