Big data, analyse de données, machine learning, data mining... vous êtes paumés ? Dîtes "data driven". Pour JF Marcotorchino, c'est cela le sens de l'histoire. Hier les statistiques étaient "hypothesis driven". On présupposait un modèle, et l'exercice d'analyse consistait à le paramétrer. Par exemple, on partait de l'idée que la taille d'une population était distribuée selon une loi de Gauss, et on calculait les paramètres de la loi. Le "data driven" ne fait plus d'hypothèse. Cela a des conséquences révolutionnaires. Et incomprises.
Exemple d'application ? M.Fillon. Les sondages croyaient connaître la population qui allait voter à la primaire des Républicains. Raté. On était dans le champ du data driven, pas des statistiques ordinaires. Mais même dans le cas de la primaire de la gauche, le data driven peut-être utile. En effet, son propre est de repérer des "anomalies". Et ces anomalies ne sont autres que l'apparition de changements. De nouvelles tendances, qui peuvent être des occasions à exploiter. Le data driven ne fait pas votre travail, à votre place, comme on nous le dit. Au contraire, il détecte des problèmes imprévus. A vous de les résoudre. Impossible de dormir avec ce machin.