Le sujet de la difficulté à rendre le plus accessible possible des données des administrations (santé, fiscale, économique…) est déjà très riche comme je viens de tenter de le résumer, mais j’ajoute ici une autre « solution », passée à la trappe à la fabrication.
Pour rappel, dans les « solutions » il y a :
– l’accès sécurisé et réservé (aux « chercheurs »)
– l’appauvrissement des données par k-anonymat, l-diversité et compagnie (un article de revue (53 pages) que je cite est ici http://www.csd.uoc.gr/~hy558/papers/privacy_survey.pdf)
– le brouillage, en injectant de fausses infos (mais pas n’importe comment)
Et donc, une autre option, que prônera aussi le groupe RiRe (Un groupe de travail, piloté par la Direction de la recherche, des études, de l’évaluation et des statistiques (Drees), qui fait suite au rapport Bras/Loth) : l’échantillonnage. C’est-à-dire fournir une partie, tirée au sort, du fichier complet. La Caisse nationale d’assurance maladie diffuse ainsi « l’échantillon généraliste des bénéficiaires » qui concerne tout de même environ un centième des assurés. Les experts du groupe de travail pensent qu’il serait possible, dans certaines conditions, de monter jusqu’à un échantillon d’un dixième de l’ensemble.
Enfin, pour éviter les déceptions éventuelles, le dossier évacue la question des données personnelles détenues par des entreprises à but lucratif (Facebook, Google, Apple…) car pour l’instant on n’en est pas à se demander comment les rendre plus « disponibles » !?!