Opinions

Dark data : exploitez-les grâce au big data !

Par La rédaction, publié le 09 septembre 2014

David-Stéphane Fala
Directeur conseil, practice big data & mobilité Micropole
 
Tous les jours, 2,5 trillions d’octets de données sont générées dans le monde, selon IBM. Conséquence : 90 % des données existantes aujourd’hui ont ainsi été créées au cours des deux dernières années… Et parmi cette masse d’informations, certaines produites par l’entreprise ne sont pas exploitées, soit par manque de moyens financiers soit par méconnaissance. Or, ces « dark data » possèdent une vraie valeur intrinsèque pour l’entreprise et constituent une mine d’informations opérationnelles qu’il ne faut pas négliger.
 
Il existe trois raisons pour lesquelles ces données « obscures » restent très peu exploitées à ce jour. Soit les données ne sont pas identifiées et ne sont donc pas collectées, soit les données sont identifiées, mais sont trop difficiles à exploiter avec les technologies classiques, soit, encore, les données sont bien disponibles au sein du système d’information, mais ne sont pas exploitables en l’état. Heureusement, toutefois, ces dark data fonctionnent à l’inverse de la matière noire (« dark matter ») : il est possible de les identifier, de les quantifier et de les rendre exploitables, pour en envisager les bénéfices.
 
Dans un rapport de 2010, McKinsey prédisait une augmentation de 60 % de la marge d’exploitation des retailers qui utiliseraient pleinement le big data. Imaginez alors les possibilités offertes par l’exploitation des données internes non ou peu exploitées ! Mais, à cet effet, comment intégrer l’ensemble de ces données non métier, produites par l‘entreprise ou la DSI, et leur donner du sens ? Grâce au big data bien sûr ! Aujourd’hui, il est en effet possible de stocker ces données et donc de les analyser.
 
La problématique essentielle liée aux dark data, après le travail d’identification, est liée à leur volumétrie conséquente et à la variété de leurs formats. Dans ce contexte, le big data apporte la possibilité de mieux connecter les systèmes de production au système d’information en apportant les outils permettant l’exploitation des données de type « machine » (logs, capteurs, archives, etc.). À la clé, pour la DSI : une diminution des coûts et une capacité d’analyse inégalable. L’avantage ? Pouvoir intervenir de manière proactive sur les machines et réduire ainsi les temps d’arrêt. Désormais, la DSI va pouvoir obtenir une vision globale de ce qui est produit, et intégrer l’ensemble des informations à la plateforme. Ce qui va ainsi améliorer son retour sur investissement.
 
Les possibilités semblent infinies : impliquer d’autres projets et d’autres métiers sur la plateforme, interconnecter différents systèmes, relier et connecter les capteurs présents dans les systèmes de production… La DSI peut alors exploiter les journaux d’activité produits par les applications ou les outils de production, et ainsi anticiper les problèmes. À la clé : un downtime réduit et des gains de productivité conséquents.
 
Une phase de cadrage en amont s’avère toutefois essentielle. Il est en effet indispensable d’assurer la meilleure connaissance possible du système afin d’estimer au plus près l’impact de ces données. C’est pourquoi il est essentiel d’impliquer les collaborateurs compétents dans ce projet. La DSI se pose alors en moteur de l’activité de l’entreprise. Ensuite, il faut avancer au cas par cas en fonction des métiers, des secteurs… Pour exemple, un projet de ce type, récemment mis en place chez un constructeur automobile, dont l’une des chaînes de montage tombait régulièrement en panne : après analyse des logs des capteurs, il a été établi que ces pannes étaient causées par une surchauffe anormale d’un ensemble de robots. D’où l’intérêt d’intégrer ce type de données urgemment pour définir précisément la cause des problèmes rencontrés. Et les anticiper.

 

Dans l'actualité

Verified by MonsterInsights