Ces temps-ci, je m’intéresse beaucoup à la métaphore, notamment après avoir lu le livre La grenouille qui ne savait pas qu’elle était cuite. Et de fil en aiguille, je suis tombé sur un outil fort intéressant nommé Sardonicus qui propose un recueil de comparaisons (ou simile en anglais) glanées sur le net via Google grâce à une méthode quasi-automatique de datamining. L’ensemble du recueil a été en outre trié en catégories, ce qui permet une consultation intuitive.
J’ai pu retrouver le texte original du travail de recherche de Tony Veale et Yanfen Hao qui explique la finalité de cet outil et comment il a été créé. Je vais donc vous résumer tout cela dans cet article…
De la comparaison à la métaphore
Traditionnellement, on assimile la métaphore à une comparaison. Cependant, la comparaison explique mal l’assymétrie d’une métaphore. Dans une comparaison, je peux invariablement dire : “un flocon de neige est aussi délicat qu’une plume” ou “une plume est aussi délicate qu’un flocon de neige”. Par contre, dans le cas d’une métaphore, l’inversion n’est pas possible. Ainsi la métaphore “mon avocat est un requin” n’a plu de sens si on la transforme en “le requin est un avocat”. Ceci est surtout dû au fait que dans la métaphore originale, il y a un transfert de sens entre la source (un requin) et la cible (mon avocat). Etant donné que l’agressivité est un concept évident chez le requin, alors qu’il ne l’est pas chez l’avocat, on ne peut pas faire le transfert inverse. Du coup, le chercheur Glucksberg a proposé une nouvelle approche de la métaphore. Au lieu de la voir comme une comparaison, il faudrait la voir comme une catégorisation. Ce qui est pratique avec les catégories, c’est qu’on retrouve le caractère irréversible de la métaphore. Ainsi lorsqu’on catégorise les espèces d’animaux, on peut dire qu’un rouge gorge est un oiseau mais on ne peut pas dire qu’un oiseau est un rouge gorge.
Le principe de la catégorisation est simple. Une métaphore donne une relation “est-un”, une relation “appartient-à-telle-classe” dans laquelle la cible est dite être un membre de la catégorie représentée par la source. La source elle-même n’est pas la catégorie où l’on place la cible. Elle est seulement un des membres de la catégorie et donne un exemple des caractéristiques de cette catégorie. Par exemple, dans la métaphore : “mon boulot est une prison”, la source, la prison, est choisie parceque c’est un membre de la catégorie créée spécifiquement pour cette métaphore. La catégorie pourrait être quelquechose du genre “espace confiné”. La cible hérite ensuite de tous les attributs de cette catégorie.
Bowdle et Gentner exposent une théorie encore plus passionnante appelée la Carrière de la métaphore. Selon cette théorie, lorsque nous rencontrons une métaphore inconnue, nous l’interprétons d’abord comme une comparaison puis peu à peu, alors que nous nous familiarisons et que cette métaphore devient plus conventionnelle, nous la voyons plus comme une catégorisation. Par exemple si je dis : “l’acrobate est comme un papillon”, puis “la patineuse artistique est comme un papillon”, puis “la ballerine est comme un papillon” je vais peu à peu voir le papillon comme appartenant à la catégorie “une activité artistique et grâcieuse”. A terme, je préfèrerai même la forme métaphorique implicite “l’acrobate est un papillon”.
Partant de là, on peut aisément faire l’hypothèse d’une chemin allant de la comparaison vers la catégorisation. Et par là même dire qu’il existerait un chemin entre la comparaison et la métaphore. D’où l’idée de Tony Veale et Yanfen Hao de générer une collection de comparaisons visant à faciliter l’esprit créatif, une sorte de créativité linguistique assistée par ordinateur en somme.
Confection du recueil de comparaisons
Résumons maintenant la méthode de collection des compaisons à travers le web. Tony Veale et Yanfen Hao se sont appuyés sur l’API Google et notamment la possibilité de rechercher en utilisant le caractère spécial *. Ainsi, ils ont pu rechercher toutes les comparaisons de la forme : “as ADJ as a|an NOUN”. Ils ont créé d’abord une liste d’adjectifs antonymes tels que ‘hot’ et ‘cold’ récupérée sur WordNet(c’est une base de donnée lexicale très utilisée dans la recherche), puis ils ont exécuté les requêtes correspondantes : “as hot as a|an *”, “as cold as a|an *” en se limitant aux 200 premiers résultats. On isole ensuite les noms les plus fréquents et on les réutilise ensuite dans la requête inverse : “as * as a|an NOUN”.
Un travail de tri est alors nécessaire puisque toutes les comparaisons ne sont pas si simples. Certaines utilisent des noms composés, ou même des expressions entières à la place du nom, qui sont donc éliminés des résultats. De plus, la comparaison est parfois ironique, et dans ce cas l’intervention d’un juge humain est nécessaire.
Une troisième étape a été enfin d’extraire le sens du mot utilisé dans la comparaison. Ceci est simple si le mot a un seul sens, mais pour les mots qui ont plusieurs sens, c’est une autre histoire. Pour pouvoir faire cela de manière automatique, c’est encore WordNet qui a été utilisé. Ainsi, l’ambiguité est levée pour un nom N1 associé à l’adjectif A si on trouve un autre nom synonyme N2 qui est également associé à l’adjectif A, ou bien si le nom N2 est proche du nom N1 (hypernyme ou hyponyme).
L’étude effectue ensuite diverses analyses mesurant la qualité des comparaisons, notamment en utilisant le dictionnaire du language affectif de Whissell. Mais je m’arrêterai là pour l’explication. Voici le lien vers la collection de comparaisons réalisée par Tony Veale et Yanfen Hao :
Sardonicus
Articles similaires (en théorie) :
Productivité des français : une des meilleures du monde?
Un outil de dépannage gratuit pour comparer des listes Excel
Le zapping de l’efficacité - volume 4
Productivité et jonglage d’assiettes tournantes
Comment trier une liste de blogs selon leur indice de popularité Technorati?