70% des données crées le sont par des individus. Mais ce sont les entreprises qui stockent et gèrent 80% d’entre elles. (source)

Aujourd’hui, ces données se comptent par milliards. L’évolution du volume de données crées a engendré des nécessaires changements pour les entreprises : nouveaux outils capables de traiter de tels volumes, développement d’algorithmes permettant de faire le tri dans ces données et d’en tirer celles qui auront une utilité, problématiques de stockage… Les spécialistes de la data s’intéressent à plusieurs notions : les 3 V du big data. IBM en a jouté un quatrième, et les a présenté dans une infographie que vous retrouverez ci-dessous. 

Volume

Le nombre de données. Cette question du volume va notamment engendré des interrogations et décisions autour du stockage et des outils pour les traiter. Il est bien souvent le premier élément que l’on regarde.

2 300 milliards gigabytes de données sont crées chaque jour. Imaginez dans 10 ans ! 

Variété

La variété correspond aux formes différentes que prennent les données : tweets, images, vidéos, e-mail, articles, données médicales… Rien que pour Twitter, 500 millions de tweets sont publiés par jour ! Sans compter les différents supports : web, mobile, TV, radio, papiers, objets connectés… Les relier, notamment pour les croiser et les comparer, les unes aux autres n’est donc pas chose facile.

Vélocité

Avec les avancées technologiques ou les nouveaux supports, créer du contenu n’a jamais été aussi facile et rapide. L’enjeu est donc de taille : traiter des énormes volumes de données différentes en un temps réduit.

Véracité

Prendre des décisions sur des données inexactes pourraient avoir des conséquences non négligeables. S’assurer de la fiabilité de la donnée est donc primordial. Et d’après l’infographie ci-dessous, 1/3 des business leaders n’ont pas confiance en l’information qu’ils utilisent pour prendre des décisions.

ibm-big-data

Ces 4 V peuvent être complétés par un cinquième :

Valeur

Une fois les 4 V connus, nous allons pouvoir créer un modèle permettant de répondre à des demandes spécifiques, d’explorer les données et d’en tirer des enseignements et insights activables pour améliorer une stratégie marketing, mettre en place de nouvelles campagnes ou encore modifier un produit.

Or, lorsqu’on parle de data, il me semble important d’en rajouter un sixième.

Visualisation

Une fois collecter, stocker, traiter et analyser, il est important de pouvoir restituer les données quantitatives et qualitatives de manière lisibles et simples. La visualisation des données (data viz) constituent pour nous une étape importante pour mieux appréhender la data. Les entreprises ont besoin de pouvoir partager facilement les informations tirées des données. C’est ce que doit permettre ce 6ème V.

 

Audrey Fleury