Alors que le nombre de données en circulation s'accélère, et qu'on parle du Big Data comme d'un impératif, l'immense majorité des contenus n'est encore ni protégée ni analysée. Un constat néanmoins normal quand on voit la rapidité du phénomène.
En 2012, plus de 2.8 zettaoctets de données personnelles ont été produites ou dupliquées par des entreprises ou des individus. Sans surprise, c'est la prolifération d’appareils mobiles, tels que les ordinateurs, tablettes ou encore les smartphones qui a contribué au doublement des données produites mondialement. Mais selon l'étude The Digital Universe, réalisée par IDC, commanditée par EMC, moins de 20% seulement de ces données auraient fait l’objet de protections ; un chiffre relativement bas selon les analystes, qui estimeraient à 35% de la masse de données requérant une sécurité. L'autre problème, c'est que seulement 0,5% auraient également été analysées. Résultat : de grandes quantités de données utiles sont perdues, à un moment où l'on commence pourtant à parler de plus en plus de Big Data. Or, rappelle le rapport, cette tendance consiste à créer de la valeur de la multitude de données produites.
Une croissance exponentielle
Pour le moment, donc, la majorité des data est constituée, souligne l'étude, de fichiers sans marquage et de données non structurées, dont il est difficile de retirer un sens. Dommage, car si l'on en croit les chiffres, en 2012, 23% de l'univers numérique aurait pu être utile si elles avaient été marquées et analysées. En 2020, ce serait 33% de l'univers numérique (plus de 13 000 exaoctets) qui pourraient avoir une valeur si ces données étaient répertoriées. Selon l'étude, cette absence d'analyse et de protection pourrait aussi avoir des incidences au niveau de la sécurité. Ce qui appelle à des mesures rapides, surtout quand on sait que cette expansion des données va aller grandissant. Le volume de données nécessitant d'être protégées croîtrait ainsi plus vite que l'univers numérique lui même. Celui-ci devrait ainsi doubler tous les deux ans entre aujourd'hui et 2020.
Une (future) répartition inégale de la génération de données ?
Pour les chiffres, il faut compter plus de 5 000 Go de données pour chaque individu à cette date. Les analystes se sont également intéressés à la production de ces données par régions géographiques. Un classement pour l’instant dominé par les Etats-Unis, qui représentent plus de 32% données produites dans le monde, devant l’Europe (19%), et la Chine (13%), mais qui pourrait être bouleversé assez rapidement. L’étude prévoit en effet que les pays émergents pourraient devancer ces zones géographiques d’ici à 2020. Une année qui verra la seule Chine produire plus de 22% des données mondiales.