Magazine Ebusiness

Le Big Data, supérieur à la subjectivité humaine dans l’orientation

Publié le 02 octobre 2014 par Pnordey @latelier

Une série de programme a démontré des capacités de prédictions supérieure à la subjectivité humaine, et c’est l’utilité de Google Map qui est une fois encore démontrée tant le stock d’images disponibles affute la pertinence des algorithmes.

Une simple photographie d’un environnement contient, grâce à l’accumulation des données et aux séries statistiques qu’il est possible d’en tirer, beaucoup plus que l’oeil humain voir. En effet, une équipe de chercheurs du MIT menée par Antonio, vient de révéler que les algorithmes ont de meilleurs taux de réussite que l’Homme lorsqu’ils sont confrontés à des choix de déplacements dans une ville car ils utilisent des régressions mathématiques sur l’ensemble des photographies stockées a priori. Le propos général de l’article des chercheurs est de démontrer en quoi une photographie de Google Map est plus qu’un ensemble de pixels. En effet, par une série d’algorithmes et une accumulation unique de photographies stokées, les chercheurs peuvent démontrer qu’une photographie donne de l’information par rapport au quartier, à la sécurité alentour ou, par exemple, à la présence d’une enseigne McDonald’s ou d’un hôpital proche. C’est donc tout le sens de l’article intitulé très explicitement Looking Beyond the Visible Scene.

L’estimation algorithmique de la sécurité urbaine

L’exemple proposé par l’équipe était de se déplacer dans quatre directions différentes, à partir d’un point de départ dans une mégalopole américaine, avec le but de trouver un McDonald’s en moins de cinq cents décisions. Or, selon les chercheurs, un individu va d’abord suivre son instinct, puis s’orienter par rapport à des intuitions personnelles, issues de ses souvenirs – liés aux villes où il a l’habitude de vivre. D’un autre côté, la puissance des algorithmes est de pouvoir isoler a priori l’espace urbain pour ensuite utiliser des lois statistiques concernant les bâtiments ou les types de rues propre à telle ou telle ville. La chaîne McDonald’s s’est immédiatement intéressée aux possibilités stratégiques d’un tel algorithme, pour perfectionner leur déploiement dans une ville donnée – degré de sécurité, affluence aux heures de pointes et d’autres variables sont désormais connues. Toutefois, les chercheurs restent les plus surpris de la performance supérieure des algorithmes sur les humains en ce qu’ils savent puiser plus systématiquement dans un ensemble de photographies stockées. En effet, la visée scientifique du projet était, avant tout, de démontrer l’intérêt des algorithmes utilisant le machine-learning par rapport à la subjectivité humaine. Par ailleurs, à force de comparer les images entre elles pour en tirer des conclusions statistiques générales, il a été démontré qu’à l’approche d’un McDonald’s, les taxis, les voitures de police et les prisons se font plus fréquents (à l’inverse des falaises et des ponts suspendus).

La visée scientifique du projet

La thèse principale des chercheurs selon laquelle une image cache plus qu’un ensemble de pixels prend ici tout son sens : la détermination d’un taux de criminalité peut être estimée de façon assez significative sans qu’aucune scène de crime ne soit effectivement visible sur la photo. L’application aux questions de sécurité urbaine a commencé par la ville de San Francisco qui a ouvert publiquement ses données sur le taux de criminalité par quartiers. Le protocole doit tout d’abord débuter par l’entraînement d’une machine, le machine-learning, sur plus de 8 millions d’images disponibles réparties entre huit villes américaines. La seconde preuve du papier de recherche consiste donc en l’estimation algorithmique des taux de criminalité grâce à l’accumulation de photographies prises sur Google Map. Les chercheurs ont d’abord montré à des humains deux photographies différentes et leur demandant de juger laquelle des deux locations leur semblait être la plus dangereuse. Le même test a été donné à leur algorithme. La précision humaine est de 60% contre 72% pour l’algorithme.


Retour à La Une de Logo Paperblog

A propos de l’auteur


Pnordey 18702 partages Voir son profil
Voir son blog

l'auteur n'a pas encore renseigné son compte