Cloud
Amazon met l’entrepôt de données en ligne
Par La rédaction, publié le 29 novembre 2012
[re:Invent 2012] le cloud d’Amazon s’enrichit d’un nouveau service à bas prix, le datawarehouse, jusqu’alors réservé aux serveurs physiques de plusieurs millions de dollars.
Amazon propose désormais dans son cloud le summum des fonctions en termes de base de données : l’entrepôt de données, ou datawarehouse. Avec le nouveau service RedShift, une entreprise peut mettre en ligne une très grande quantité de données commerciales, afin d’analyser son contenu et de mieux appréhender ou anticiper la bonne marche de ses affaires. Jusqu’à présent, ce type de solutions n’était disponible que chez Oracle, IBM, Greenplum et autre Teradata, au travers d‘imposants serveurs de plusieurs millions de dollars, à installer et à entretenir.
« Avec le service RedShift, on annule la complexité de la maintenance et l’on propose de s’acquitter d’une fraction du prix habituel, pour une capacité qui peut changer du jour au lendemain », a lancé Andy Jassy, le vice-président en charge des services web d’Amazon (AWS), lors du premier salon re:Invent que le fournisseur consacre à ses offres cloud.
En l’occurrence, Redshift, qui n’est pas encore disponible, devrait coûter 1000 dollars par an et par téraoctet de données en ligne, là où une solution physique coûte entre 19 000 et 25 0000 dollars par an et par téraoctet de données. « Nous apportons la fonction du datawarehouse à des PME, à des petits commerces qui n’ont pas 10 ou 20 millions à investir », illustre Terry Wise, le directeur commercial des services web d’Amazon.
Le téraoctet à 23 cents de l’heure
RedShift vient compléter une offre déjà riche de solutions de bases de données en ligne chez Amazon. Le fournisseur propose déjà dans son cloud une base SQL (RDS), une base non SQL de type Hadoop (Elastic MapReduce) et une base non SQL spécifiquement dédiée aux applications dites de big data (DynamoDB).
Dans l’offre RedShift, l’utilisateur choisira deux types de nœuds de calcul. Le plus simple disposera de deux cœurs de calculs, de 16 Go de mémoire, de 2 To de capacité de stockage et coûtera 0,85 cent par heure d’utilisation. La version 8XL proposera 16 cœurs, 128 Go de mémoire, 16 To de stockage et coûtera 6,80 dollars par heure d’utilisation. Des rabais seront consentis si l’utilisateur s’engage sur un ou trois ans. Ainsi, le prix horaire du nœud de base pourra descendre à 0,23 cent. Il sera par ailleurs possible de cumuler les nœuds pour atteindre la capacité maximale de 1,6 Po de stockage.
Selon Amazon, la boutique en ligne Amazon.com utilisait auparavant un cluster de 32 serveurs qui lui offrait 128 processeurs, 4,2 To de mémoire et 1,6 Po de stockage. Elle l’a remplacé par deux nœuds 8XL RedShift qui lui coûte 32 000 dollars par an et se révélerait 10 fois plus rapide.
Compatible avec les progiciels existants
Surtout, RedShift se veut compatible avec les progiciels de gestion existants. Il s’agit d’une base de données compatible avec les requêtes SQL et, de même que les autres solutions de datawarehouse, elle est programmable au travers des interfaces JDBC et ODBC. « Avec RedShift d’un côté, et les progiciels de SAP, Microstrategy ou Jaspersoft que nous hébergeons déjà dans notre cloud, les entreprises n’ont même pas besoin de redéployer une solution de Business Intelligence, se félicite Terry Wise. On leur propose juste de changer la tuyauterie pour gagner en performances et payer moins cher. »
Reste à connaître les performances. Amazon se refuse à publier des chiffres, mais promet de ressortir gagnant dans les tableaux comparatifs des solutions actuelles, « ne serait-ce que sur les performances du retour sur investissement », s’amuse à dire Terry Wise.