Un nouveau moteur de recherche pour Gallica, la bibliothèque numérique de la BnF

Par Benard

Un nouveau moteur de recherche pour Gallica, la bibliothèque numérique de la BnF ]

Gallica est une mine d’informations tant pour les chercheurs que pour le grand public. Gratuite et accessible à tous, elle offre 1,3 millions de documents numérisés.

Gallica est une mine d’informations tant pour les chercheurs que pour le grand public. Gratuite et accessible à tous, elle offre 1,3 millions de documents numérisés. On y trouve aussi bien des livres, des journaux, des estampes, des cartes postales et des affiches que des partitions musicales, des documents sonores, des manuscrits ou des cartes. Gallica est consultée en moyenne quotidiennement par 25 000 visiteurs et a connu une progression de 85 % de son audience en 2010 passant de 4 à 7,5 millions de visites.

Pour faciliter l’accès à ces ressources et permettre d’en appréhender toute la richesse, laBnFva doter d’ici la fin de l’année sa bibliothèque numérique d’un nouvel outil de recherche interne : le moteur d’indexation et de recherche sémantiqueCloudViewconçu par la société Exalead, filiale du groupe Dassault Systèmes qui équipe déjà de nombreux sites institutionnels français parmi lesquels l’INA, le CNRS, les Journaux Officiels et France 24. Choisi à la suite d’un appel d’offre européen, ce nouveau moteur à la pointe de l’innovation technologique augmentera la pertinence des résultats et offrira une navigation dansGallicaplus simple et plus confortable favorisant les liens entre différents documents.

Parmi les nouveautés proposées, on retiendra une aide à la saisie incluant un correcteur orthographique ainsi qu’une fonction de désambiguïsation permettant d’affiner une recherche en distinguant les termes pouvant prêter à confusion, notamment les homonymes. Par exemple, pour la requête ‘avocat’, un choix entre la profession et le fruit sera soumis. Des suggestions basées sur les requêtes des autres utilisateurs pourront également être proposées. Grâce à un paramétrage précis, le moteur donnera les formes approchantes des termes recherchés, une orthographe erronée aura donc peu d’incidence sur le résultat de la requête. Enfin, les différentes formes d’un même mot (selon l’accord en genre et en nombre, les variantes) seront prises en compte et intégrées aux résultats de la recherche.

Lire la suite : http://cblog.culture.fr/2011/04/15/un-nouveau-moteur-de-recherche-pour-gallica-la-bibliotheque-numerique-de-la-bnf