Trop de données ?

Publié le 08 avril 2012 par Fmariet

David Weinberger, Too Big to Know: Rethinking Knowledge Now That the Facts Aren't the Facts, Experts Are Everywhere, and the Smartest Person in the Room Is the Room, 2012, 11,69 $ (kindle)
Trop d'informations et de données à notre disposition dont on ne sait pas la valeur (knowledge overload). Comment ces données sont-elles organisées (metadata), liées (hyperlinked) pour nous trouver, tomber sous nos yeux ? D'où nous sont-elles données ?
Le problème a-t-il pris une ampleur nouvelle avec la mise à disposition des conversations, des données personnelles (réseaux sociaux), avec la consultabilité, l'accessibilité de toutes sortes de documents (produits par les bureaucraties, les administrations, les laboratoires, les médias) ? Un tel constat ne semble  pas nouveau ; il est même au principe de la réalisation d'encyclopédies : au 2e siècle avant notre ère en Chine (huainanzi淮南子), au XVIIIe siècle (Europe)...
Chaque époque trie et met en avant des documents, définissant les savoirs importants, légitimes et leurs modes de classement. Les technologies d'accès semblent toujours en retard sur le volume des données qu'elles ont rendu accessibles.
L'ouvrage de David Weinberger, en bon généraliste et journaliste vulgarisateur, tente une synthèse des problèmes et solutions apportés par le Web. Il les énonce dans les termes de la koinè du Web mais, au moins, il nous épargne les pseudo données statistiques de rigueur et invite à penser Internet dans nos vies, depuis nos vies. Le livre a les inconvénients de ses qualités : on aimerait évidemment que certains points soient approfondis, mais ce n'est pas l'objectif.
Avec le Web, ce n'est pas seulement la quantité d'information disponibles qui s'accroît mais aussi les relatives commodités d'accès qui s'améliorent (restant inégales toutefois selon les personnes et les institutions) et surtout le nombre de personnes accédant à ces données. La scolarisation (dont l'apprentissage des langues) réduit les inégalités d'accès à l'écrit (or, "nous sommes gouvernés par des écrits", répète Pierre Legendre) ; le Web réduit les inégalités d'accès aux documents, aux informations, aux données. Ce constat étant dressé et illustré, mais non démontré, les objections sur les nuisances du Web étant écartées (le Web rend bête, etc. objections faîtes déjà à L'Encyclopédie), David Weinberger en vient à des questions plus difficiles, parmi celles-ci :
  • La sélection et la vérification des données (curation, rôle du modérateur) se heurte au volume des données à traiter. La presse, qui fut prompte à se lancer dans l'écriture partagée et l'interaction avec les lecteurs, fut aussi prompte à y renoncer (cf. le cas du wikitorial du Los Angeles Times cité par l'auteur, ou, plus récemment, le cas du quotidien 20 minutes bloquant les commentaires sur les assassinats politiques de Toulouse au nom d'une "charte de modération"). Ces situations soulignent que tout élément publié est un filtrat et que le filtre est la définition opérationnelle de ce qui est dicible ("politiquement correct"), à un moment donné, dans un lieu donné. Le Web n'a pas desserré la censure de l'expression publique.
  • La pensée formée par le livre au long format ("book-shaped thought", "long-form book") par opposition à la pensée issue du Web et des formats courts (plus doxographiques). Peut-on penser sans les livres, sans que leurs caractéristiques techniques forment la pensée (début / fin, paragraphes, etc.) ? Par son ouverture, le Web exerce une tentation (distraction ?) ; tous les liens qu'il adjoint au savoir exposent, trament un savoir sans fin, un livre qui ne se ferme pas, s'écrit en continu, et tendrait vers une sorte de "grand livre du monde" galiléen. Le Web comme facteur d'irrésolution ?
  • Les publications scientifiques : avec ou sans comité de sélection (les pairs). Trop de science ? Les revues Nature et Science refusent 98% des articles qui leur sont soumis (sans compter l'auto-censure des auteurs). Risque de conformisme et de restriction de l'innovation. Tous experts, crowd science  ?