Le traitement de l'information doit prendre en compte l'attention de l'utilisateur

Pour traiter l'information sur les réseaux sociaux, il ne faut pas uniquement s'attarder sur les liens entre les membres de celui-ci, mais prendre en compte leur attention parfois limitée.

Pour parer au trop-plein d'informations sur les réseaux sociaux, il serait bon de prendre en compte le niveau d'attention qu'un utilisateur peut avoir face aux données qui l'intéressent. Or, la majorité des recherches sur le sujet tentent de déterminer les centres d'intérêt d'un utilisateur uniquement par le biais des liens (publications, partages et retweets...) entre les différents utilisateurs connectés à un même réseau. Des chercheurs de l'institut des sciences de l'information de Marina del Rey (Californie) et de l'université du Maryland ont donc mis au point un algorithme prenant en compte cette donnée afin d'essayer de prioriser les publications sur leur fil d'actualité.

Le vote, meilleur indicateur de l'attention

Les chercheurs ont donc dans un premier temps appliqué celui-ci aux données présentes sur Digg, un site d'information permettant aux utilisateurs de voter pour les articles les plus intéressants. Le but était, grâce à leur algorithme, de prédire les centres d'intérêt des individus. Et si ce site en particulier a été choisi, c'est parce que le principe même de vote tend à prouver, selon les chercheurs, l'attention donnée par un utilisateur à un thème. Ils ont ainsi passé en revue pour 2009, 70 000 utilisateurs, 3 500 articles et 2,1 millions de votes, et pour 2010, 12 000 utilisateurs, 48 000 articles et 1,9 million de votes. A partir de ces informations, ils se sont concentrés sur les votes ayant permis la promotion d'un article et cela, via les recommandations entre « amis » du réseau.

Un logiciel plus précis que les précédents

Les chercheurs ont ensuite comparé les performances de leur système par rapport à ceux utilisés par d'autres chercheurs avant eux. Ils ont ainsi constaté que l'algorithme surpasse au niveau de la prédiction de 1% à 3% les habituels modèles génératifs probabilistes utilisés dans ce genre d'étude comme par exemple l'allocation de Dirichlet latent. Mais plus encore les chercheurs affirment que le logiciel arrive à prédire plus de 30% des votes au final (contre 11% pour une prédiction au hasard). Cet algorithme ayant prouvé son efficacité, la prochaine étape sera de dévoiler les mécanismes à l'origine de l'attention des utilisateurs des réseaux sociaux.