Les innovations sont presque toujours le fait d'explorateurs individuels ou de petits groupes, et presque jamais celui de bureaucraties importantes et hautement structurées. (Harold J. Leavitt)Toute entreprise a pour obligation d'enregistrer ses opérations comptables, et se trouve ainsi pourvue d'un ensemble parfois colossal de données. Les experts-comptables et autres contrôleurs de gestion savent bien à quel point l'exploitation de ces données permet à une entreprise d'améliorer sa gestion et d'augmenter ses résultats.
Plus généralement, lorsqu'une entreprise dispose de données nombreuses concernant l'un des aspects de son activité, elle peut espérer l'exploiter. Ainsi, dans le domaine commercial, des outils de gestion de la relation client (ou CRM, pour Customer Relationship Management) fleurissent dans de nombreuses entreprises car elles permettent, outre la tenue à jour de l'historique des échanges avec chaque client ou prospect, d'analyser quels sont les différents profils de clients, ce qu'ils achètent ou n'achètent pas... Cela permet aux vendeurs de proposer des produits ou services ciblés et ainsi d'optimiser l'effort commercial.
Pourtant, ces données sont parfois nombreuses : données d'essais R&D, historique de réglage d'une production industrielle, liste d'incidents... Existe-t-il des techniques pour en tirer parti ?
L'exploration des données
L'exploration de données, ou Data Mining, est une approche d'acquisition de connaissances à partir de données brutes. Typiquement, elle conduit à 4 opérations :
- la recherche de relations,
- le regroupement,
- la classification,
- et la régression.
Le regroupement consiste à observer dans les données l'existence de groupes similaires. Un marketeur analysant les habitudes de consommation d'un produit dans divers pays européens pourra ainsi identifier des pays ayant une culture de consommation similaire (par exemple : les pays nordiques, les pays slaves et germaniques et les pays latins), et imaginer des produits différents pour chaque type de pays. En marketing, cela s'appelle de la segmentation.
La classification consiste à définir quels données correspondent à une classe parmi une liste définie à l'avance. L'exemple-type est le filtre anti-spam de nos serveurs de courrier électronique.
Enfin, la régression vise à déterminer une fonction mathématique qui prédit les résultats associés avec une combinaison de paramètres avec un minimum d'erreur. Cette capacité à prédire est très appréciée par les décideurs, notamment les chefs d'entreprise pour des raisons évidentes.
Deux entreprises basées sur le data mining
La société TecKnowMetrix utilise des techniques d'analyse lexicale (une forme de data mining spécifique aux bases de données textuelles) pour analyser notamment les bases de brevets. Cela permet de savoir quelles entreprises et quels laboratoires travaillent sur une problématique, et constitue donc un outil de veille technologique particulièrement puissant et original.
La société Expernova propose, sur le même principe, l'analyse des publications scientifiques de divers laboratoires pour permettre l'identification des chercheurs experts dans un domaine technologique spécifique.
Ces deux sociétés sont basées sur des outils d'exploration des données textuelles.
Data mining et médiation technique
Un médiateur technique n'a pas pour vocation de faire de l'exploration de données : il y a des spécialistes pour cela. Toutefois, il y a deux aspects du data mining qui sont pertinents pour le médiateur technique.
D'une part, le client peut avoir besoin d'un expert en data mining. Et plus spécifiquement, d'un expert maîtrisant l'une des méthodes d'exploration des données. Il en existe en effet des dizaines, issues pour certaines des statistiques, d'autres de l'intelligence artificielle, et certaines méthodes sont spécifiques à un type de données (géographiques, par exemple).
D'autre part, le client peut aussi avoir besoin de connaissances sur un sujet technique. Or une entreprise spécialisée dans ce domaine, et qui dispose d'une longue expérience matérialisée dans une base de données, n'a pas forcément cherché à faire une analyse de ces données dans le sens du besoin du client. Le médiateur technique fera alors appel à un expert de l'exploration de données pour obtenir les connaissances souhaitées par le client à partir de l'historique de l'entreprise spécialisée.