D’autres robots du même type, utilisés par les polices et Services de renseignements de tous les pays, rampent dans les recoins les plus sombres du réseau à la recherche de pédophiles ou terroristes. En effet, le renseignement par ce biais est devenu un enjeu stratégique majeur.
C’est dans ce contexte que dès 2007, l’armée française lançait un appel d’offres portant sur les “conception réalisation et évaluation d’une plateforme dédiée au traitement des sources ouvertes pour le renseignement militaire d’intérêt stratégique”. Cette plateforme a été baptisée HERISSON pour “Habile Extraction du Renseignement d’Intérêt Stratégique à partir de Sources Ouvertes Numérisées”.
Le terrain de jeu de ce robot est immense puisqu’il s’étend depuis les médias classiques (télévisions, radios) pour aller jusqu’aux réseaux de peer-to-peer en passant par les réseaux sociaux, flux RSS ou autres newsgroups et blogs.
Le crawler est un athlète à sa façon car il doit être capable de lire tous les formats écrits, audio, vidéo ou d’images. Mais le plus important de tout, les données collectées doivent être rendues exploitables et opérationnelles. Il ne s’agit pas de collecter pour le plaisir mais de scruter dans un but de défense du territoire. L’analyse derrière la collecte doit pouvoir permettre d’identifier une personne sur des photos ou vidéos collectées sur le web.
Les outils informatiques quelque peu fantasmatiques des différentes séries américaines entreraient de plain-pied dans la réalité.Ce projet est tout simplement sidérant. Le militaire y voit un outil formidable ; l’informaticien, un défi remarquable ; le citoyen, un moyen d’espionnage ; l’avocat une possible atteinte aux libertés fondamentales.