Hier j’entends à la radio un débat sur la numérisation par Google des fonds des bibliothèques. Hervé Kabla m’avait déjà fait entrapercevoir le sujet, mais l'affaire ne s'éclaircit pas :
Le débat
Je ne comprends pas les arguments qui s'affrontent.
- M.Jeanneney dénoncerait l’emprise de l’intérêt, du monopole et de l’Amérique sur la culture française. Inutile d’aller plus loin dans la démonstration, on a caractérisé l’axe du mal ?
Lui (Google) confier, et à lui seul, qui vit du profit de la publicité et est enraciné, en dépit de l'universalité de son propos, dans la culture américaine, la responsabilité du choix des livres, la maîtrise planétaire de leur forme numérisée, et la quasi-exclusivité de leur indexation sur la Toile, le tout étant au service, direct ou indirect, de ses seuls gains d'entreprise, voilà bien qui n'était pas supportable.
- Alain-Gérard Slama semble dire que l’on va aboutir à du Wikipedia, qu’il ne trouve pas sérieux (argument d’autorité), il en aurait aussi après le mode de recherche de Google, qui égarerait même les meilleurs esprits. Il faudrait nous protéger de cet insidieux outil de lavage de cerveau ?
- Une objection rationnelle, cette fois : différence de droit de propriété entre l’Europe et les USA.
- Du côté pour, on veut se précipiter, parce que, dans la numérisation qui se fait à l’étranger, il y a des livres français : la culture française va être représentée par une sélection américaine. Argument de MM.Jeanneney et Slama pris à l’envers.
C’est bizarre, mais on ne parle pas tellement de diffusion de connaissance. Le but des bibliothèques, c’est pourtant cette diffusion, de masse, non ? Je ne vois pas comment on peut rêver mieux qu'une numérisation systématique couplée à un accès démocratique. Et si l’opposition au projet venait de ceux dont le rôle est de dire au peuple ce qu’il doit penser ? Si c’est le cas, on a un choc des civilisations : pour l’Américain la culture n’est pas élitiste, mais populaire.
L’enquête
Je suis allé voir de quoi il s’agissait.
- Aujourd’hui, très peu de documents sont téléchargeables (l’accès or USA est bridé), ou, simplement, visibles intégralement. Pour cela, il faut qu’ils aient été publiés au 19ème siècle ou avant, et encore. L’idéal est d’être équipé d’un e-book, de façon à pouvoir lire confortablement les pdf téléchargés.
- J’ai téléchargé un livre de Tom Paine publié au 18ème siècle. C’est relativement rapide, et résultat (y compris imprimé) de bonne qualité : plus facile à lire que l’original (et on n’a pas peur d’abîmer l’ouvrage). Ce qui est épatant, c’est qu’il est possible de faire de la recherche plein texte, et celle-ci reconnaît les caractères anciens (par exemple falsehood s’écrivait falfehood au 18ème). C’est une fonction remarquablement utile, même pour les livres que l’on possède (pour retrouver un passage, je suis obligé de me reposer sur ma mémoire et sur les notes que je prends en marge de ce que je lis).
- Ce qui expliquerait l’effroi de nos hommes de culture, c’est que, comme Amazon, Google fait des suggestions d’ouvrages apparentés à ce qui semble la recherche du lecteur. Risque de manipulation ? Mais, si l’on en craint une, pourquoi ne pas la dénoncer, une fois que l’on en aura la preuve, ou proposer d’autres moyens de recherche ?
La rentabilité
Paradoxalement, ce que je ne comprends pas, c’est la rentabilité du projet :
- Microsoft a tenté l'aventure et a jeté l'éponge, après avoir numérisé un million de livres.
- Pierre Bazin, qui dirige la bibliothèque de Lyon, numérisée par Google, disait que le coût de la numérisation de 500.000 livres (d’un intérêt, en moyenne, extrêmement limité) était 60m€, à quoi il faut ajouter la maintenance des bases de données, et le dispositif pour les rendre accessibles.
- Pour le moment, et pour sûrement encore longtemps, seuls les chercheurs auront un intérêt pour ce site. Pour le reste, il semble plutôt une boutique de promotion pour les librairies en ligne : la plupart des recherches donnant un livre non téléchargeable, et orientant vers sa version papier.
- Quant aux revenus, on parle de publicité. Mais la publicité sur Internet ne rapporte rien, sauf à la fonction moteur de recherche de Google. Je ne vois pas le type de publicité qui peut rentabiliser des milliards de $ d’investissement (si j'extrapole les chiffres de Lyon). Commission sur les ventes de livres suscitées par Google Books ? Mais il faudra en vendre des centaines de millions par an, non ?...
Conclusion du moment
S'il y a danger, c'est celui de l'acquisition d'un bien commun (la connaissance) par un monopole. Cependant, aujourd'hui nous n'avons aucun autre moyen de l'obtenir. D'ailleurs, parmi ceux qui pourraient nous l'apporter, Google semble à la fois le plus rapide, et le moins dangereux pour notre indépendance intellectuelle.
Si l’on prend une optique à moyen terme, le projet semble formidablement intéressant. Paradoxalement, ce qui m’inquiète est sa rentabilité. N'avons-nous pas intérêt à ce que Google aille le plus loin possible dans son travail, tout en nous assurant que nous saurons récupérer et utiliser ce travail si Google fait faillite ?
Compléments :
- Pour la première fois de ma vie, j’ai été innovant (sans le faire exprès) : on peut trouver mon dernier livre sur Google books.
- Un aperçu de l’opinion de Jean-Noël Jeanneney (contre), et un autre de Pierre Bazin (pour), et pourquoi Harvard et d’autres ont choisi la numérisation par Google, et le projet Microsoft.
- Curieusement ce débat sur les moyens d’acquérir un bien commun illustre parfaitement la théorie économique (The Logic of Collective Action). Si on la suit, Google n’est pas optimal pour administrer le dit bien, le mieux, mais c’est compliqué à mettre en œuvre, est une gestion « démocratique » (Governing the Commons - plus ou moins le modèle Wikipedia).