L’entreprise Hitachi a mis au point un système qui utilise le machine learning pour prédire la criminalité.
De nombreux auteurs de Science Fiction ont pensé des technologies capables de prévoir le futur pour mieux enrayer la criminalité. La plus célèbre d’entre elles est sans doute le logiciel Précrime, adopté par la police de New-York dans Minority Report, de Steven Spielberg, basé sur une nouvelle de Philip K. Dick. Rien de réaliste dans cette technologie, toutefois, qui s’appuie sur des individus capables de lire l’avenir dans leurs rêves. La psychohistoire, pensée par Isaac Asimov, se rapproche davantage de ce que l’on commence à élaborer aujourd’hui. Cette science fictive permet de prévoir l’avenir, et notamment les phénomènes sociaux, à l’aide d’analyses statistiques forgées sur un grand nombre de données. Une idée qui évoque les perspectives ouvertes aujourd’hui par le traitement des mégadonnées. L’entreprise Hitachi vient ainsi de dévoiler un système capable de prédire la criminalité dans une ville grâce à une importante quantité de données, traitées à l’aide du machine learning. Il sera testé dans une demi-douzaine de villes américains à partir du mois d’octobre, selon le site FastCompany.
Des prédictions basées sur les données brutes
Le système mis en place par Hitachi utilise différentes sources de données susceptibles d’agir sur la criminalité. Liste non exhaustive : météorologie, proximité d’une école ou d’une station de métro, appels au 911, coups de feu, mouvements de population et, bien sûr, statistiques sur la criminalité. Ces données sont ensuite traitées via la méthode du machine learning, avec le logiciel de statistiques R. Si de nombreuses initiatives visant a prédire la délinquance ont déjà éclos, peu avaient jusque là recours au machine learning : les outils traditionnels se concentrent généralement sur un panel de données restreint, sélectionnées par l’être humain en fonction de leur pertinence supposée. Ici, nulle intervention humaine : la machine se contente de brasser d’énormes quantités de données et d’en tirer des modèles d’analyse prédictifs. Issus de données brutes, sans interprétation ni spéculation aucune, ceux-ci seraient donc plus fiables. « Confronté aux dizaines, voir centaines de variables susceptibles d’impacter, la criminalité, un cerveau humain est tout simplement dépassé. », affirme ainsi Darrin Lipscomb, qui a participé au développement de cette technologie, dans les colonnes de FastCompany.
De l’importance des réseaux sociaux
Les résultats se présentent sous la forme d’une carte de la ville en question assortie de codes couleurs indiquant différentes composantes de la délinquance et leur risque d'occurrence selon les zones géographiques. Il est possible de sélectionner une zone spécifique, d’une taille minimale de 200 mètres carrés, à laquelle sera associé un niveau de menace calculé sur une échelle de 0 à 100%. L’analyse des données issues des réseaux sociaux jouerait un rôle particulièrement important dans la prédiction de la criminalité. Lipscomb affirme que la plupart des gangs utilisent des termes issus de leur propre jargon pour planifier une action sur ces derniers, et que l’algorithme est capable de détecter un terme anormal utilisé à forte dose dans une certaine zone géographique, annonçant ainsi de potentiels troubles à venir. Certaines villes du programme pilote mettront les prédictions directement au service de la police, qui pourra ainsi déplacer ses hommes en fonction des risques potentiels. D’autres ne dévoileront les prédictions effectuées par l’algorithme qu’à la fin du programme, afin de comparer celles-ci avec les chiffres de la délinquance effectivement recensés par la police.