http://www.lejdd.fr/Societe/Cedric-Villani-Le-big-data-va-booster-la-recherche-contre-le-cancer-845156
INTERVIEW - Cédric Villani, mathématicien, directeur de l’Institut Henri-Poincaré et lauréat de la médaille Fields, conseille le projet Epidémium sur l’épidémiologie du cancer.
Cédric Villani dans son bureau de l'institut Henri-Poincaré à Paris. Pour lui, "la question de l'analyse des données existantes sur le cancer à travers le monde est vitale". (Jérome Mars pour le JDD)Première cause de mortalité en France avec 150.000 décès en 2015, le cancer fait chaque année plus de 8 millions de victimes à travers le monde! Alors que se tenait samedi la Journée mondiale contre le cancer, un nouveau chapitre de la longue lutte contre le "crabe" commence toutefois à s'écrire, plein de promesses. Il a pour nom Epidemium. Lancé conjointement en 2015 par le très institutionnel laboratoire Roche, leader dans les traitements anticancéreux, et La Paillasse, "laboratoire ouvert et communautaire", le principe de ce projet de recherche scientifique et médicale repose sur l'open science. Il s'agit, en utilisant un big data sous-exploité dans le domaine de la santé, de "réinventer l'épidémiologie du cancer". Comment? En permettant au plus grand nombre, scientifiques dûment estampillés comme profanes ou patients intéressés, de travailler sur les milliards et milliards de données existantes sur cette maladie. Une mutualisation des énergies qui doit booster nos connaissances pour permettre, au final, de mieux la comprendre, la prévenir et la guérir. Alors que sera publié jeudi le Livre blanc d'Epidémium, "rapport d'étape" qui retrace un an de travaux ayant rassemblé un millier de personnes, le JDD a demandé à son préfacier Cédric Villani, figure du savant multimédaillé et ultra-curieux, de nous expliquer les enjeux du croisement entre big data et cancer.En quoi l'approche d'Epidemium est-elle originale?
Epidemium souhaite, dans le domaine de la santé, utiliser de façon systématique les données statistiques des grandes bases de données afin de les croiser pour, par exemple, détecter ou évaluer des situations à risque. Il s'agit ici, en mariant big data et cancérologie, en associant "big pharma" et geeks, de faire travailler en collaboration ouverte une très importante communauté de personnes qui n'ont pas forcément une expertise médicale, informaticiens, ingénieurs et autres, qui mutualisent leurs efforts de recherche. Avec Epidemium, le big data est pour la première fois utilisé en France à cette échelle au profit de la recherche médicale.Comment ce projet peut-il, concrètement, faire avancer la recherche sur le cancer?
Le cancer est une maladie multifacteur et multiforme. À côté de son aspect clinique, la question de la simple analyse des données existantes à travers le monde est vitale. Le problème, c'est qu'elles sont innombrables et de tous formats, c'est un vrai bazar… Nous devons donc recenser ce matériau, trouver ses points communs, puis l'analyser et enfin le rendre accessible au plus grand nombre. Mais on se retrouve alors, pour prendre une image, face à des tableaux Excel de 1 million de lignes! Pour s'en dépatouiller, pour manipuler ces données, nous n'avons qu'un outil : ce fameux big data, mélange de statistiques, d'analyse, d'optimisation et d'informatique XXL.A-t-on déjà obtenu des résultats?
C'est encore trop tôt, mais plusieurs projets au sein d'Epidemium sont prometteurs. Baseline par exemple, qui développe une base de données à partir d'une centaine de pays et d'une multitude de facteurs de risques– de la consommation d'alcool au cholestérol en passant par l'appartenance à un groupe ethnique – et cherche à en déduire une prédiction de risques multifactorielle. Ces données aideront les soignants comme les décideurs. Mais la grande affaire en cours, c'est aussi la mise au point de nouveaux algorithmes, de nouvelles recettes d'analyse mathématique adaptées au contexte.
«La grande affaire en cours, c'est la mise au point de nouveaux algorithmes, de nouvelles recettes d'analyse mathématique adaptées au contexte»
Des algorithmes qui, vous le savez, font toujours un peu peur…Je n'ai jamais compris ces fantasmes sur les algorithmes, qui existent quand même depuis quatre mille ans. Quand vous faites une multiplication, c'est un algorithme ; une recette de cuisine, c'est encore un algorithme. Et là, dans notre bataille contre le cancer, sujet complexe s'il en est, les algorithmes nous permettront d'obtenir des informations pertinentes. Imaginez que dans une base de données de 100.000 individus, vous deviez identifier dans le patrimoine génétique les facteurs de risque de développer tel ou tel type de cancer… et trouver une corrélation entre telle ou telle case, perdues dans le tableau! L'humain, seul, est impuissant face à une question si complexe ; il nous faut le secours de la machine. Nous avons cinquante ans de théorie en la matière, mettons-les enfin au service de notre santé.Jusqu'à ce que la machine remplace les médecins en faisant des diagnostics à leur place?
Mais bientôt les médecins auront leur assistant algorithmique qui leur fournira des probabilités pour telle ou telle pathologie. Et il n'y a aucun doute que l'algorithme permettra au toubib, en moyenne, de se tromper encore moins qu'aujourd'hui. Bien sûr, les malades et leurs proches ne sont pas prêts à confier leurs émotions à cet algorithme, et je les comprends. Mais je vous assure que l'alliance homme-machine sera plus forte que l'homme seul ou que la machine seule. C'est là où nous devons aller. Sans oublier d'aborder les questions éthiques que cela pose!Sans les maths, pas de progrès en santé?
Je ne dis pas cela, je constate juste que cette discipline fait avancer la recherche, sur le cancer en particulier. Des équipes travaillent, par exemple, sur la modélisation mathématique pour prédire l'évolution d'une tumeur en fonction d'un nombre très élevé de paramètres, dont quelques-uns ont une influence critique. À l'arrivée, le travail de ces chercheurs, non médecins, sera une aide pour les soignants lorsqu'ils devront décider par exemple de la date d'une opération. L'alliance maths-médecine est multiforme et c'est d'ailleurs le sujet d'un groupe de travail commun aux académies des sciences et de médecine, dont je suis coorganisateur.Le big data permet une "démocratisation" de la recherche. Est-ce la fin d'un entre-soi académique, avec une caste d'experts en vase clos dans leurs labos?
Démocratisation n'est pas le bon mot car tout le monde dans cette recherche ouverte et planétaire n'est pas égal. Développer un algorithme reste une affaire de pros, et les compétences des experts restent indispensables. Il ne s'agit donc pas de virer les savants mais d'y associer une communauté beaucoup plus large. Avec Epidemium, on va certes bien au-delà du cercle des cancérologues, mais nous ne pourrons jamais nous passer d'eux. Leur expertise restera indispensable.
Richard Bellet - Le Journal du Dimanche
6 février 2017