Le projet a en fait été lancé en 2009, dans un mode apparemment expérimental, avec une équipe réduite. Sans surprise, le constat de l'immense volume de données existantes, mais non exploitées, a été le principal déclencheur des réflexions initiales. Celles-ci ont abouti à la création d'un entrepôt de données centralisé basé sur une infrastructure Hadoop (l'archétype des solutions "big data"), connecté à une multitude de sources d'information hétérogènes.
En effet, l'objectif est bien de concentrer toute l'information au sein d'une plate-forme unique et transverse. Et cela comprend aussi bien des données de transactions bancaires, stockées sur les grands systèmes (mainframes), que des mails ou des discussions sur les réseaux sociaux, qu'ils concernent les domaines métiers (comptes, emprunts...) ou des éléments techniques (journaux et traces des logiciels...).
Plusieurs applications sont désormais en production (ou en passe de l'être) et elles reflètent bien cette diversité. Deux d'entre elles touchent au domaine des risques, plus précisément la lutte anti-blanchiment et les calculs de ratios de solvabilité. Dans les deux cas, les gains de productivité sont gigantesques : la première est capable d'analyser 6 mois d'historique en 20 secondes et la deuxième traite l'intégralité de la base client en 1/4 d'heure là où le système existant prenait 48 heures pour analyser un échantillon.
Dans un domaine beaucoup plus technique mais tout aussi critique, un outil de supervision des infrastructures, prenant en compte des indicateurs de toutes natures (au niveau des logiciels et matériels informatiques comme du métier), devrait permettre d'améliorer la qualité de service globale.
Pour terminer ce tour d'horizon, les clients ne sont pas oubliés puisqu'ils peuvent (ou pourront ?) profiter d'un accès à 10 ans d'historique de leurs transactions, via un moteur de recherche plein texte. Une double nouveauté qui pourrait transformer la gestion des finances personnelles (un peu comme [Bank] Simple tente de la dessiner depuis quelques mois).
Après la phase pionnière, qui a vu la mise en place une infrastructure d'un peu plus d'une centaine de machines et dotée d'une capacité de 800 To, un centre d'expertise est en cours de constitution pour accompagner les projets. Et ceux-ci devraient arriver rapidement puisque les idées se bousculent, de l'analyse des commentaires libres dans les formulaires à l'exploitation des données de navigation sur le web pour affiner les ciblages marketing, par exemple...
A ce stade de la démonstration, les bénéfices de l'approche "big data", qui s'étendent sur différents axes, sont déjà évidents : accélération des traitements existants (lutte anti-blanchiment), création d'offres différenciantes (banque en ligne), amélioration de la pertinence des techniques en place (stratégie marketing)... A ceux-là, il faudra aussi ajouter les avantages, encore "invisibles", découlant notamment de l'accès universel offert à toutes les données de l'entreprise, sous toutes leurs formes.
Enfin, pour enfoncer le clou, les coûts du projet du Crédit Mutuel Arkéa ont probablement de quoi faire pâlir toutes les spécialistes du décisionnel "classique", car, outre les ressources humaines qui y ont été consacrées (1,5 personnes pendant 24 mois), la totalité de l'infrastructure matérielle représente un investissement de moins d'1 million d'euros. En regard des bénéfices affichés, le seuil de rentabilité doit pouvoir être atteint en un temps record !
Certes, la mise en œuvre complète du système a probablement été plus complexe que ne le laisse entrevoir cet aperçu et il reste à affronter la difficulté que représente l'exploitation pertinente des masses de données ainsi accumulées (qui requiert des spécialistes, rares sur le marché de l'emploi). Mais, alors que la plupart des banques en sont encore à écrire des notes de prospective sur le sujet "big data", le Crédit Mutuel Arkéa prouve qu'il est possible de passer à l'action dès aujourdhui et pourrait aussi démontrer très rapidement que ces technologies sont capables de lui procurer un avantage concurrentiel considérable.
Information repérée grâce à N. Guillaume (merci !)