Depuis quelques mois, le concept "big data", issu des géants de l'internet (Google, Facebook, Twitter...) et de leurs besoins de traitements massifs d'information, est souvent évoqué comme une tendance inéluctable dans les entreprises traditionnelles. Pourtant, les exemples d'implémentation sont encore rares et le cas du groupe bancaire Zions Bancorporation constitue donc une exception, qui en suscitera peut-être d'autres...
C'est lorsqu'il s'est rendu compte, en 2008, que les entrepôts de données ("datawarehouses") classiques qu'il utilisait commençaient à atteindre leurs limites, que le CSO ("Chief Security Officer", responsable de la sécurité) de la banque a exploré de nouvelles solutions. Après avoir évalué plusieurs options, dont celles proposées par ses fournisseurs historiques (Microsoft et Oracle), il a finalement retenu, malgré son immaturité, l'offre "Security DataWareHouse" (SDW) de Zettaset, basée sur Hadoop et quelques autres technologies émergentes du monde "big data".
Et l'enjeu était de taille : pour les équipes en charge de la sécurité globale de l'organisation, la capacité à accumuler sur une longue période et traiter très rapidement, voire en temps réel, la masse de données issues des équipements de sécurité (firewalls, outils de détection d'intrusion...) et des systèmes transactionnels est critique pour détecter et enrayer au plus tôt les attaques et autres tentatives de vol d'information et de fraude dont la banque est la cible quotidiennement.
Pour rendre l'équation encore plus complexe, comme toujours dans ces contextes, la volumétrie (qui pourra atteindre plusieurs péta-octets avec SDW) n'est pas le seul obstacle à la pertinence de l'analyse : l'hétérogénéité des données sources, structurées ou non, est difficilement appréhendée par les plates-formes classiques. Or, à l'inverse, cette capacité constitue un des points forts des nouvelles solutions "big data".
Pour la mise en œuvre de son entrepôt de données, Zions a adopté une démarche prudente et raisonnée. Tout d'abord, la préparation a été soigneusement orchestrée, de manière à parfaitement maîtriser les possibilités offertes par (et les limites de) la nouvelle plate-forme. Puis, à partir de début 2011, les systèmes décisionnels ont été migrés progressivement, sur une période de plusieurs mois, en commençant par les moins sensibles. Le déploiement est maintenant achevé et le CSO se félicite de pouvoir désormais ajouter de nouvelles sources de données à ses analyses en quelques jours, là où il fallait autrefois plusieurs mois.
L'exemple de Zions Bancorporation pourra servir d'inspiration aux responsables de sécurité (et, au-delà, dans tous les métiers) d'autres grandes entreprises. Cependant, il souligne aussi (plus ou moins directement) la difficulté que peut représenter une transition des bases de données relationnelles vers des plates-formes "big data". La durée de migration (longue) illustre en effet le temps qu'il faut pour bien en maîtriser les tenants et aboutissants, pour garantir le succès et éviter des expérimentations finissant en impasse.
De plus, une question qui n'est pas abordée dans ce retour d'expérience mais est tout aussi critique pour les résultats est celle de l'expertise analytique (mathématique) requise pour exploiter correctement les multiples sources d'information qui deviennent disponibles avec ces systèmes. Car s'il peut être utile de disposer de péta-octets de données à portée de souris, encore faut-il savoir comment les traiter pour en faire ressortir une quelconque valeur.