N'en déplaise à ceux qui, se livrant régulièrement sur les réseaux sociaux, se veulent encore mystérieux, nous serions nettement plus transparents que nous souhaitons le penser. C’est en effet ce que révèle les chercheurs internationaux ayant contribué à la publication de Personality, Gender and Age in the Language of Social Media : the Open-Vocabulary Approach. S’appuyant sur le même type d’approche qui avait permis à Google, avant le CDC américain, de prévenir le développement de l'épidémie de grippe en 2010, les chercheurs ont réussi à définir à la fois le sexe des individus en fonction de leurs publications mais également leur profil psychologique.
5 grands caractères émergent
Grâce à l'approche multidisciplinaire, sciences sociales d'un côté et linguistique numérique de l'autre, les chercheurs sont parvenus à faire apparaître des grands axes au sein de ces quelques 750 millions de mots provenant des publications de 75 000 volontaires environ. Ainsi, la différence homme-femme tout d'abord semble nous rappeler que, si les clichés existent, ils partent souvent d'une certaine vérité. La récurrence de certains termes selon le genre est ainsi édifiante, les chercheurs ayant ainsi réussi à différencier le sexe de l'utilisateur selon une grille de mots typés. Toujours selon l'étude, ce sont du côté féminin shopping, excited et love qui semblent les plus caractéristiques, tout comme Xbox, whishes ou fuck chez les hommes. Au delà de ce caractère anecdotique, se sont 5 grands axes, selon le modèle des Cinq Facteurs, qui apparaissent. L'aspect extraverti, agréable, neurotique, consciencieux et l'ouverture permettent ainsi, uniquement par le biais des messages postés, de construire un profil psychologique structuré de l'internaute.
Un outil qui pourrait profiter à de nombreux domaines
Si l'on peut remettre en question la véracité des informations que les individus choisissent de poster sur les réseaux sociaux, cette analyse montre que ceux-ci s'avèrent extrêmement révélateurs lorsqu'ils sont pris en grand nombre. Avec le développement de plate-formes sociales, générales mais aussi de plus en plus dédiées à des activités particulières, l'approche Open Vocabulary pourrait se traduire par un ciblage de plus en plus efficace. Dans la publicité certes, mais aussi plus largement dans l'analyse statistique de l'humeur d'une population. On pourrait même penser à certaines applications médicales, et ce plus particulièrement dans le cas de la détection par exemple chez les adolescents de symptômes de mal-être voire de signes avant-coureurs de dépression.