Le Big Data

Avec le développement d’internet, des échanges et des technologies, les entreprises brassent et stockent des quantités sans cesse croissantes de données : c’est ce qu’on appelle « Big Data », expression signifiant littéralement « données massives ».

Quelles sont les données désignées sous le terme de Big Data ?

Bien qu’il n’existe aucune définition officielle de l’expression « Big Data », il est communément admis que sont regroupées sous ce terme des informations diverses telles que :

  • les emails et autres contenus des messageries
  • les localisations GPS des utilisateurs
  • les informations concernant les achats en ligne
  • les photos et vidéos publiées sur le net
  • la majorité des données échangées sur internet

Le concept des 3V

Avec le « Big Data », les entreprises se retrouvent face à une triple problématique dite « des 3V » :

  • volume : ces sociétés doivent stocker et gérer une quantité très importante de données, nécessitant l’utilisation de machines toujours plus puissantes. Des ordinateurs ayant une capacité de stockage exponentielle. Que les systèmes de stockage soient le nuage en anglais « cloud » ou des supports locaux (ordinateurs, disques divers), ou des sauvegardes simultanément en local et dans le « cloud ».
  • vélocité : les entreprises ont un autre impératif, la vitesse. Il faut collecter et partager certaines données quasiment en temps réel.
  • variété : les informations brassées sont très variées, structurées de manières différentes et proviennent de multiples sources. Il est donc généralement très complexe, voire impossible, de les rendre homogènes pour les intégrer dans une seule et même base de données. Ce blocage oblige parfois les entreprises à conserver les données sous des formes multiples ce qui rend leur exploitation plus compliquée.

Les technologies liées au Big Data

Pour conserver et gérer cette masse d’informations, les entreprises utilisent :

  • les technologies de stockage avec notamment le « cloud computing » en français « stockage dans le nuage ».
  • les technologies de traitement adaptées dont les bases de données conçues pour les données non-structurées et les méthodes de calcul haute-performance.

Big Data : les enjeux pour l’avenir

Qu’elle soit voulue ou subie, la prolifération des données cause des difficultés et présente des enjeux importants pour le futur.

  • Les enjeux économiques : la plupart des informations sont contrôlées par les quatre géants du web communément appelés « GAFA » expression désignant Google, Apple, Facebook et Amazon. Ce quatuor détient des milliards de données sur tous les humains : informations médicales, sanitaires, bancaires et de consommation.
  • Les enjeux de société : inutile de préciser que nous ne contrôlons pas les données que nous communiquons ni celles recueillies par les « cookies » savamment placés dans les codes de la plupart des navigateurs que nous utilisons pour surfer sur le web.

Les entreprises spécialisées dans le domaine

Certaines entreprises spécialisées dans l’informatique telles que IBM, SAP, Oracle ou encore HP ont anticipé cette montée en puissance du « Big Data ». Idem pour les spécialistes des solutions « Big Data » tels que Teradata ou Hortonworks. Les développeurs de logiciels de « Big Data » tels que Captain Dash, Squid ou encore Criteo sont aussi sur ce marché de l’exploitation des données.