Data / IA
Les SGBD se multiplient en entreprise, mais SQL Server résiste
Par Laurent Delattre, publié le 14 février 2024
Le dernier rapport Redgate sur le panorama des bases de données révèle que si les SGBDR traditionnels, SQL Server en tête, résistent aux vagues des nouvelles bases, le paysage des SGBD en entreprise ne cesse de se diversifier mais surtout de se complexifier.
Le nouveau rapport « State of Database Landscape 2024 » de Redgate souligne la tendance croissante des organisations à adopter toujours plus de systèmes de gestion de bases de données différents : le nombre d’entreprises utilisant plus de deux SGBD a augmenté de 17% au cours des trois dernières années. Désormais, 79% des entreprises utilisent au moins deux SGBD différents et près de 30% des organisations utilisent plus de 5 SGBD différents.
C’est la principale information à retenir de ce rapport réalisé à partir d’une enquête mondiale auprès de 3.849 DSI et DBA dans 15 secteurs différents. Mais ce n’est pas la seule. Loin de là.
Une multiplicité synonyme de complexité
La montée – depuis deux décennies – des bases no-SQL, la quête de la diminution des dépenses par l’adoption des bases open source, la poussée des bases graphes et bases vectorielles à l’ère de l’IA, la recherche de souplesse via les bases serverless et managées dans le cloud mais aussi la diversité des sources de données et l’explosion des données non structurées… tout contribue à métamorphoser le paysage des SGBD au sein des entreprises.
Cette diversification des SGBD différents au sein des entreprises n’est donc pas une surprise et traduit à la fois une évolution des pratiques, des besoins et des cas d’usage.
Reste que cette inflation, cette diversité croissante, engendre complexité et nouveaux défis. Pour gérer cette nouvelle tendance à la multiplicité des bases de données, les administrateurs de bases de données (DBA) et les développeurs doivent forcément acquérir de nouvelles compétences pour dompter, gérer et surveiller ces bases de données et en maîtriser les coûts, explique David Gummer, directeur des produits chez Redgate : « Il est clair que les organisations se démènent actuellement pour faire face à une complexité accrue, aux pressions de la conformité et aux technologies émergentes telles que l’IA et le cloud, et cherchent des solutions pour réduire le déficit de compétences ».
Comme le rappelle ce rapport, les différences entre les diverses plateformes de données sont souvent considérables que l’on parle du langage de requêtage, des modèles de données, de l’architecture ou des fonctionnalités proposées. Multiplicité rime avec complexité. Et cette diversité exige davantage de compétences chez les DBA comme chez les développeurs et les architectes de données.
Les SGBDR font de la résistance
De façon plus amusante et ludique, Redgate profite de son étude pour mesurer la popularité des différents SGBD ni en se basant sur une présence sur les réseaux sociaux (comme le font certaines études, cf. encadré) ni en s’appuyant sur les revenus générés en dollars (comme le font généralement les analystes comme Gartner ou Forrester) mais en s’appuyant sur le nombre d’instances réellement déployées par les entreprises interrogées.
Et à ce petit jeu fort instructif, c’est SQL Server de Microsoft (rappelons-le depuis quelques années disponibles à la fois sur Windows et sur Linux) qui arrive très largement en tête.
D’une manière générale, force est de reconnaître que les SGBDR (bases relationnelles) classiques font de la résistance. Ils dominent le Top 5 et seul MongoDB arrive à se glisser en 5 ème position. Il est important de noter que ce classement cumule les instances déployées « on-premises » et celles déployées dans le Cloud.
Autre enseignement important, PostgreSQL (souvent présenté comme l’alternative open source à Oracle Database pour sa forte compatibilité avec cette dernière) est désormais passé devant Oracle en termes d’instances déployées. Voilà qui confirme à la fois la très forte progression de PostgreSQL ces dernières années mais aussi la montée des bases en open source, très largement représentées dans ce TOP 15. Si l’on additionne le nombre d’instances, les bases open source sont sans commune mesure plus déployées que les bases propriétaires.
Enfin, on s’étonnera de la présence toujours très marquée de Microsoft Access. Présente depuis plus de 25 ans dans le paysage des entreprises, la base de données – bien que désormais très peu poussée par Microsoft mais toujours présente dans Office/Microsoft 365 – demeure le SGBD « Desktop », d’équipes et de TPE le plus populaire.
L’impact de la diversité des sources de données
Et quitte à évoquer la popularité des plateformes de données, l’étude de Redgate y a ajouté une autre dimension : « pour quoi faire ? ». Car désormais la donnée est très souvent non structurée, voire multimédia. Une réalité qui a favorisé l’adoption de différents types de données. D’autant que certains usages, comme l’IA notamment mais aussi l’analyse géographique, invitent également à choisir des SGBD plus adaptés à ces usages.
Si SQL Server, MySQL, PostgreSQL et Oracle Database dominent le stockage des données structurées, Redis et Elastic Search ont la faveur des données semi-structurées, MongoDB portant l’étendard des données non structurées. Et s’il n’est vraiment pas surprenant de voir les bases de données No SQL open source dominer l’univers des données géospatiales et des graphes, on retiendra qu’IBM DB2 reste très populaire dans ce domaine grâce à ses extensions DB2 Spatial Extender et DB2 Graph (très employées sur mainframes).
Les SGBD cloud séduisent de plus en plus
Enfin, l’étude Redgate s’intéresse également à l’adoption du cloud dans les bases de données. Sans surprise, celles-ci révèlent que la plupart des entreprises (70%) utilisent un mixte de bases on-premises et de bases dans le cloud. La donnée et les besoins de la protéger et d’en assurer la confidentialité restent le moteur des approches hybrides.
Mais l’étude montre quand même une progression des entreprises ayant opté pour 100% de bases de production dans le cloud (elles passent de 11% en 2020, 15% en 2021 à 18% en 2023) au détriment des approches « 100% On premises » qui baissent de 26% en 2020 à 12% seulement en 2023 !
Selon ce rapport, les entreprises migrent leurs données dans le cloud pour y rechercher principalement de la scalabilité et de la flexibilité (48% des entreprises interrogées), de la haute disponibilité et de la fiabilité (45%), et de la réduction des coûts (34%)
Autre point beaucoup plus instructif, l’étude s’intéresse surtout à la stratégie employée dans les migrations vers le cloud. Sur le fond, deux approches sont possibles : simplement déployer dans le cloud des instances comme on le ferait en local en s’appuyant sur les services IaaS des fournisseurs ou, au contraire, chercher à s’affranchir des problématiques de maintenance et mises à jour en optant pour des bases managées ou serverless au travers des offres PaaS des fournisseurs.
Et l’enquête révèle ainsi que le PaaS est effectivement en train de prendre le pas sur la gestion d’instances IaaS même si la répartition des bases entre PaaS et IaaS reste encore équilibrée.
Au final, ce rapport éclaire un paysage des SGBD où la tendance à la multiplication et la diversification des plateformes semble inévitable et invite les DSI à une réflexion renouvelée sur l’avenir de la gestion des données dans leur entreprise et plus encore de leur gouvernance dans un monde de plus en plus hétérogène. Comment les organisations peuvent-elles maintenir l’équilibre entre diversité technologique et gestion efficace de la complexité ? Quelles compétences seront nécessaires pour les professionnels de demain afin de tirer le meilleur parti de cet environnement hétérogène ? L’adoption croissante du cloud et des SGBD serverless apparaît comme une réponse naturelle à ces questions mais soulève les traditionnelles questions de sécurité, conformité, souveraineté et confiance.
Au-delà de la résilience de certains acteurs historiques comme SQL Server, l’avenir des SGBD en entreprise se jouera demain sur la capacité des organisations à intégrer des technologies disparates dans une stratégie cohérente de gestion des données quitte à massivement passer au Cloud. Il s’agit là d’une opportunité à saisir pour repenser les modèles de gouvernance et explorer de nouvelles façons d’exploiter la donnée, avec l’IA en tête.
Une autre vision du marché des SGBD
Il existe différentes façons de mesurer la popularité des différentes plateformes de données. Le rapport Redgate se focalise sur les instances déployées et donc une réalité de présence au sein des entreprises. Forcément, l’historique pèse lourd dans une telle approche.
Le site DB-Engines cherche lui davantage à mesurer l’intérêt des DBA et développeurs pour les différentes plateformes. Sa mesure ne tient pas compte des déploiements en entreprise, mais agrège en revanche les mentions à ces technologies sur le Web, sur Google Trends, sur les sites de support (comme DBA Stack Exchange), sur les offres d’emploi (Indeed, Linkedin) et sur Twitter.
Le paysage ainsi tracé est alors évidemment fort différent. Il reflète davantage « l’intérêt » que « la réalité en production ».
Sans surprise, Oracle, MySQL et SQL Server se tiennent dans un mouchoir de poche mais leur popularité décroit (très lentement) depuis une décennie alors que PosgreSQL ne cesse de grimper. Il est intéressant de voir que dans l’univers Cloud, Snowflake est sensiblement plus populaire que DynamoDB, Azure SQL, Databricks et Google BigQuery.
À LIRE AUSSI :
À LIRE AUSSI :