Lifting numérique pour Gallica

Par Savatier

Pour le curieux, le chercheur, le bibliophile ou le simple lecteur, les bibliothèques numériques gratuites n’ont plus à démontrer leur utilité. Pouvoir consulter un document sans avoir à se rendre sur place constitue un gain de temps très appréciable. Elles se concentrent donc aujourd’hui sur deux axes principaux de modernisation : un enrichissement constant des catalogues et une interface plus conviviale, incluant des fonctionnalités supplémentaires. C’est dans cet esprit que la Bibliothèque nationale de France a officiellement annoncé l’ouverture de son site Gallica 2 à l’occasion du Salon du livre de Paris.

Gallica, dans sa première version qui devrait rester accessible jusqu’à la fin de l’année, n’offrait jusqu’à présent que des ouvrages, des périodiques et des documents numérisés en mode image dont les droits étaient tombés dans le domaine public (du Moyen-Âge au XIXe siècle, plus des archives sonores). On y trouve également des dossiers thématiques multimédias.

Gallica 2 présente une plus grande interactivité ainsi qu’un progrès dans les modalités de navigation et de recherche. Ainsi, le mode « plein texte », qui permet une recherche de mots dans les ouvrages électroniques, constitue un outil très utile. Il faut toutefois souligner que la fiabilité de ce mode, qui ne concerne actuellement qu’une partie des livres disponibles, reste assez approximative. Le traitement OCR (reconnaissance optique de caractères) des pages numérisées en format .pdf s’accommode en effet assez mal des polices rares ou des lettres accentuées, et encore plus mal, naturellement, des pages parfois détériorées. Ce problème se rencontre d’ailleurs de manière identique dans la bibliothèque numérique de Google qui rassemble les fonds de plusieurs bibliothèques universitaires anglo-saxonnes (incluant un fonds assez riche d’ouvrages en français).

L’une des nouveautés de Gallica 2, c’est de permettre l’accès à certaines publications récentes, disponibles au format numérique via des sites de e-distributeurs (en accès libre ou moyennant le paiement d’un droit). Ce service n’existe pas chez Google qui n’affiche, dans certains cas, qu’un aperçu limité des livres et renvoie systématiquement aux sites de librairies en ligne. Le nombre de titres consultables via Google est en outre bien plus restreint que ne l’annonce le nombre des résultats du moteur de recherche. Des livres anciens, donc libres de droits, numérisés par des universités, demeurent curieusement inaccessibles, créant une frustration très compréhensible chez les chercheurs qui se voient renvoyés vers des bibliothèques européennes ou américaines !

Parmi les nouvelles fonctionnalités de Gallica 2, signalons un mode de recherche avancée amélioré et la possibilité de créer un espace personnel pour y entreposer des documents. La BnF prévoit d’ajouter à son catalogue des fonds de bibliothèques partenaires, ce qui devrait faciliter d’autant le travail des chercheurs. Il restera à évaluer, lorsqu’elle sera mise en ligne au-delà d’une simple démonstration, la future bibliothèque européenne Europeana qui devrait regrouper les ressources digitales des bibliothèques et principaux musées de l’Union européenne.