Chaque métier possède son jargon, et celui-ci constitue souvent un obstacle à une bonne compréhension entre interlocuteurs. L'abondance des anglicismes professionnels en France révèle, au-delà des effets de mode, une paresse linguistique parfois synonyme de difficulté de transcription conceptuelle.
Force est de constater qu'en France - contrairement à la créativité langagière de nos cousins québécois - nous sommes plus friands de marketing que de mercatique, de web que de toile, ou encore d' emailing que de publipostage électronique... il en va de même du datamining et de la fouille de données ...
Pourtant, en pratique, le recours aux anglicismes se justifie très rarement. Ainsi de l'emblématique management, terme dont le périmètre sémantique, certes, regroupe à la fois les notions de gestion, d'organisation et de direction, mais pour lequel le mot pilotage convient tout à fait pour synthétiser ces significations multiples.
Faux débat ? Pourquoi se compliquer l'idiome quand il suffit d'emprunter des mots là où la nouveauté s'invente - autrement dit chez les anglo-saxons ? A quoi bon se fatiguer à créer, en français, alors que l'anglais nous fournit un prêt-à-parler tellement plus in, fashion, voire hype ? La fouille de données, c'est franchement plus long à dire et à écrire que datamining, non (et en plus, c'est moins chantant) ?
Chaque jargon professionnel français se construit par vagues successives : on importe un terme (sans forcément le définir, du moins au début), on le diffuse à grande échelle, on articule un discours tout autour du terme importé (en convoquant souvent d'autres anglicismes), on commence à en clarifier et en approfondir le sens... puis on propose des traductions de substitution ... quelquefois, l'une de ces traductions s'impose au sein d'une communauté professionnelle, qui la promeut, et lorsque le consensus public rejoint l'académisme linguistique savant, on insère le nouveau terme dans un ou plusieurs dictionnaires - lesquels sont aussi, quelquefois, sujets à controverse...
Le mot datamining en est au stade collectif des propositions de traductions : la prééminence du mot anglo-saxon demeure, bien que dans le monde francophone on ressente de plus en plus la nécessité d'en expliquer le contenu et d'en faire connaître les concurrents francisés - ma préférence allant, de très loin, à sa version la plus explicite et la plus fidèle au sens originel : la fouille de données.
D'ailleurs, en français, une confusion existe encore entre, d'une part, la fouille de données (datamining), et, d'autre part, l'extraction des connaissances à partir des données (knowledge discovery in databases). Le datamining est l'art d'extraire des connaissances à partir des données. Cette extraction des connaissances à partir des données constitue une ingénierie qui utilise les techniques du datamining.
L'objectif des techniques de datamining est d'aboutir à des connaissances opérationnelles, exprimées sous forme de modèles mathématiques réutilisables sur le terrain et périodiquement perfectionnés, et ainsi faire parler l'intelligence qui se cache dans vos données ... sans jargon, et en toute clarté !