L’IA au service de la recherche scientifique

Publié le 24 avril 2017 par Pnordey @latelier

De nombreuses techniques sont à l’étude pour mettre l’intelligence artificielle au service de la recherche scientifique, afin d’aider les chercheurs à emmagasiner rapidement des connaissances ou de repérer les travaux les plus prometteurs. Elles sont toutefois conçues pour assister l’humain et non le remplacer.

Lors de la dernière édition de l'événement EmTech Digital, à San Francisco, Dario Gil, vice-président du département scientifique chez IBM Research (d’où vient notamment le superordinateur Watson), a présenté ses travaux visant à mettre l’intelligence artificielle au service des chercheurs. Son ambition est d’utiliser l’apprentissage machine (machine learning), technique d’intelligence artificielle qui permet à un programme de s’améliorer avec l'expérience, pour extraire l’information d’un grand nombre de papiers de recherche scientifique. L’ordinateur pourrait ensuite corréler les informations concordant entre divers travaux de recherche, et tisser des graphs de connaissance susceptibles d'améliorer la recherche dans un domaine bien précis. De là à affirmer que dans un futur proche, l’évaluation par les pairs, étape-clef de la recherche scientifique au cours de laquelle les travaux d’un chercheur sont évalués par plusieurs spécialistes du domaine, sera confiée à des machines, il n’y a qu’un pas. Un pas que Dario Gil s’est bien gardé de franchir. En revanche, d’autres l’ont fait pour lui.

Ainsi, dans un article récemment publié par Wired, le journaliste Nick Stockton s’interroge : « L’évaluation par les pairs a ses défauts. Les humains (y compris les scientifiques) sont biaisés, feignants et intéressés. Parfois, ils sont mauvais en maths (même les scientifiques). Il est donc sans doute inévitable que certains songent à retirer les humains de l’équation, pour les remplacer par l’intelligence artificielle. Après tout, les ordinateurs sont impartiaux, attentifs et n’ont pas un grand sens de l’ego. Ils sont en outre, par définition, bons en maths. ». Egalement présent à EmTech Digital, Gary Marcus, professeur en sciences cognitives à l’Université de New-York, appelait quant à lui de ses voeux, un logiciel capable de digérer l’ensemble des publications scientifiques récentes dans une branche bien spécialisée de la recherche médicale, afin de recouper les différentes informations pour proposer de nouveaux traitements. Des chercheurs de la Northwestern University, à Chicago, ont même mis au point une méthode d’intelligence artificielle capable de prédire quels papiers de recherche auront un impact important dans un domaine spécifique. Tous ces projets reposent sur la capacité de l’intelligence artificielle à décrypter le langage humain et à formuler des réponses, domaine dans lequel d'impressionnants progrès ont été réalisés au cours des dernières années. Il est aujourd’hui possible d’avoir des conversations basiques avec des assistants virtuels comme Siri ou Alexa. Les publications scientifiques constituent naturellement un échelon de difficulté supérieur (longueur et complexité du texte, jargon, référence à des théories extérieures…), mais pas inatteignable.

Alexa

L’importance de l’élément humain

Il est facile de voir le potentiel de telles expérimentations. Une intelligence artificielle suffisamment performante pourrait repérer les chercheurs les plus prometteurs dans un domaine, et assurer qu’ils bénéficient de la reconnaissance nécessaire, ainsi que des moyens matériels et humains pour mener à bien leurs recherches. Elle pourrait trouver, dans chaque branche, des résonances entre les travaux de différents chercheurs disséminés dans le monde entier, naviguer à travers la gigantesque base de données des publications scientifiques pour tisser des corrélations qu’aucun humain n’aurait pu voir, et ainsi faire progresser la recherche bien plus rapidement. Elle pourrait enfin faciliter les applications commerciales et grand public de la recherche, en dégageant quelques cas d’application concrets à partir de publications touffues et hermétiques. L’entreprise Insilico Medicine utilise ainsi l’intelligence artificielle pour parcourir les dernières publications médicales à la recherche de composants susceptibles d’être utilisés dans des médicaments. Il est également facile de voir les dérives. Ainsi, si l’on supprime l’humain du processus d’évaluation de la recherche, comment s’assurer que cette dernière continue de s’orienter dans un but bénéficiant à l’humanité ? Dans un futur plus éloigné, pourquoi ne pas imaginer que les recherches elles-mêmes soient effectuées par des machines, supprimant les humains du processus ?

Nous sommes cependant loin d’en être à ce stade-là. Les expérimentations actuellement menées sont bien plus humaines et raisonnables. Chercheuse à l’University College London, Isabelle Augenstein utilise l’intelligence artificielle pour permettre aux chercheurs de rassembler rapidement des connaissances dans un domaine précis. Elle souhaite ainsi concevoir un programme capable de restituer n’importe quelle publication dans un format concis et structuré, contenant les principaux concepts développés et les liens tissés entre eux, afin de permettre aux chercheurs de les parcourir plus rapidement. Et faciliter ainsi leurs travaux. En 2016, elle a, dans cette optique, mis en place une compétition, baptisée ScienceIE. Les participants étaient invités à mettre au point un programme susceptible d’extraire les faits basiques d’un article de recherche, et de les comparer avec les faits cités dans d’autres articles consacrés à un domaine similaire. Selon la chercheuse, si les résultats sont prometteurs, nous sommes encore très loin de concevoir des machines capables de lire et comprendre n’importe quel papier de recherche. « La compréhension linguistique appliquée à de longs documents, à la structure variée, demeure très difficile et constitue un défi pour la recherche. Certaines tâches, comme le repérage de phrases-clefs dans des articles scientifiques, peuvent être automatisées avec des résultats honorables. Mais nous n’avons pas encore de programmes capables de répondre à des questions sur un texte, hormis dans quelques situations très simples. Par exemple, on peut concevoir un programme capable de répondre à une question sur un paragraphe spécifique de Wikipedia, à condition que l’on sache que la réponse est contenue dans le texte et que nous ayons des centaines de milliers d’exemples similaires sur lesquels entraîner le programme. »

Ainsi, pour Isabelle Augenstein, il n’est absolument pas question de remplacer les chercheurs humains par des machines, mais simplement d’utiliser certaines techniques d’intelligence artificielle pour simplifier le travail… des humains. « Les tâches difficiles, qui nécessitent une compréhension parfaite du langage, nécessiteront toujours une intervention humaine. En revanche, l’intelligence artificielle peut directement bénéficier aux chercheurs, en leur permettant d’être plus productifs. »

Des techniques perfectibles

Un avis partagé par Ernest Davis, professeur en sciences informatiques à l’Université de New-York. Si travailler à construire des programmes susceptibles de comprendre et résumer le contenu des publications scientifiques est selon lui un projet à fort potentiel, à la fois pour l’intelligence artificielle et la recherche, il affirme également que nous n’en sommes pour l’heure qu’aux balbutiements. « Prenons les mathématiques, par exemple. Il devrait s’agir de la discipline la plus simple, puisque chaque démonstration peut être exprimée dans une forme purement logique, vérifiable par l’ordinateur. En outre, la technologie pour évaluer la validité d’une démonstration est déjà là. Cependant, pour l’heure, convertir la démonstration d’un mathématicien français ou anglais sous une forme purement logique requiert une immense quantité de travail humain, et le recours à des chercheurs spécialisés en mathématiques et en intelligence artificielle. Nous sommes très loin de pouvoir automatiser ce processus. Si l’on prend d’autres disciplines, comme la psychologie ou l’informatique, le problème devient encore plus difficile. Nous n’avons absolument aucune idée de la manière de décrire une expérience psychologique et les théories auxquelles elle fait référence sous une forme intelligible pour un ordinateur. »

Peu de chances, donc, pour que nous voyions apparaître des chercheurs robots dans un futur proche. L’intelligence artificielle sera sans doute capable de simplifier une partie du travail de recherche, en extrayant les informations issues de différentes publications pour les présenter sous un format concis et intelligible, permettant ainsi aux chercheurs de gagner du temps. Peu probable, en revanche, que les travaux du futur Einstein soient évalués par des machines, et encore moins qu’il soit lui-même un robot.