Le Big Data

Avec le développement d’internet, des échanges et des technologies, les entreprises brassent et stockent des quantités sans cesse croissantes de données : c’est ce qu’on appelle « Big Data », expression signifiant littéralement « données massives ».

Quelles sont les données désignées sous le terme de Big Data ?

Bien qu’il n’existe aucune définition officielle de l’expression « Big Data », il est communément admis que sont regroupées sous ce terme des informations diverses telles que :

  • les emails et autres contenus des messageries
  • les localisations GPS des utilisateurs
  • les informations concernant les achats en ligne
  • les photos et vidéos publiées sur le net
  • la majorité des données échangées sur internet

Le concept des 3V

Avec le « Big Data », les entreprises se retrouvent face à une triple problématique dite « des 3V » :

  • volume : ces sociétés doivent stocker et gérer une quantité très importante de données, nécessitant l’utilisation de machines toujours plus puissantes. Des ordinateurs ayant une capacité de stockage exponentielle. Que les systèmes de stockage soient le nuage en anglais « cloud » ou des supports locaux (ordinateurs, disques divers), ou des sauvegardes simultanément en local et dans le « cloud ».
  • vélocité : les entreprises ont un autre impératif, la vitesse. Il faut collecter et partager certaines données quasiment en temps réel.
  • variété : les informations brassées sont très variées, structurées de manières différentes et proviennent de multiples sources. Il est donc généralement très complexe, voire impossible, de les rendre homogènes pour les intégrer dans une seule et même base de données. Ce blocage oblige parfois les entreprises à conserver les données sous des formes multiples ce qui rend leur exploitation plus compliquée.

Les technologies liées au Big Data

Pour conserver et gérer cette masse d’informations, les entreprises utilisent :

  • les technologies de stockage avec notamment le « cloud computing » en français « stockage dans le nuage ».
  • les technologies de traitement adaptées dont les bases de données conçues pour les données non-structurées et les méthodes de calcul haute-performance.

Big Data : les enjeux pour l’avenir

Qu’elle soit voulue ou subie, la prolifération des données cause des difficultés et présente des enjeux importants pour le futur.

  • Les enjeux économiques : la plupart des informations sont contrôlées par les quatre géants du web communément appelés « GAFA » expression désignant Google, Apple, Facebook et Amazon. Ce quatuor détient des milliards de données sur tous les humains : informations médicales, sanitaires, bancaires et de consommation.
  • Les enjeux de société : inutile de préciser que nous ne contrôlons pas les données que nous communiquons ni celles recueillies par les « cookies » savamment placés dans les codes de la plupart des navigateurs que nous utilisons pour surfer sur le web.

Les entreprises spécialisées dans le domaine

Certaines entreprises spécialisées dans l’informatique telles que IBM, SAP, Oracle ou encore HP ont anticipé cette montée en puissance du « Big Data ». Idem pour les spécialistes des solutions « Big Data » tels que Teradata ou Hortonworks. Les développeurs de logiciels de « Big Data » tels que Captain Dash, Squid ou encore Criteo sont aussi sur ce marché de l’exploitation des données.

L’utilisation du Big Data pour stimuler les ventes

Toutes les entreprises cherchent à augmenter leur part de marché. Mais les plus petites n’ont pas forcément les moyens financiers leur permettant de payer pour réaliser des études. Ce que ces sociétés ignorent, c’est qu’elles détiennent beaucoup de données qui, lorsqu’elles sont savamment exploitées, peuvent leur permettre de mieux connaître les besoins des consommateurs.

Comment utiliser les données pour booster ses ventes ?

Pour un budget raisonnable, il existe des formations permettant de comprendre les données collectées, de les analyser et de les interpréter en les modélisant sur un tableau de bord organisé de manière pertinente. Une fois cet outil convenablement utilisé, des décisions stratégiques peuvent être prises de façon éclairée. En effet, le « Big Data » permet :

  • la création de nouveaux modèles de vente
  • l’identification de nouveaux produits à lancer sur le marché
  • la valorisation des données qui d’une part, augmente la valeur de l’entreprise elle-même (Facebook est un exemple). Ces données peuvent également être cédées à des entreprises extérieures.

Le Big Data et les PME

Au départ réservés aux grosses entreprises, les applications liées au « Big Data » sont aujourd’hui accessibles aux PME. Elles peuvent, comme les grands groupes connecter leurs données-clients avec celles du marché. Par exemple, les dirigeants de petites entreprises peuvent désormais :

  • analyser les comportements d’achat de leur clientèle en ligne comme en boutique dans le but d’effectuer des réapprovisionnements avant de se retrouver en rupture de stock et de louper des ventes
  • utiliser les données récoltées sur les médias sociaux et le site web de l’entreprise pour mettre en place des actions (publicités, promotions, offres ciblées…) permettant d’améliorer le « taux de conversion », c’est-à-dire transformer plus de prospects en clients et augmenter la valeur moyenne des achats
  • comparer les données « transactionnelles » avec celle des concurrents afin notamment de mesurer le succès des produits et services nouveaux et d’identifier les produits les plus recherchés par les clients.

Le lien entre le renseignement industriel et le Big Data

En même temps que le « Big Data » a émergé le concept moderne de « renseignement industriel », un des aspects de l’intelligence artificielle, un aspect intéressant. Cette expression désigne en fait l’ensemble des activités permettant de prendre des décisions éclairées et d’instaurer des actions basées sur des données, de la collecte à la prise de décision, en passant par le stockage et l’analyse, dans le but d’augmenter ses revenus de l’entreprise.

C’est là qu’intervient également la notion « CRM », action s’inscrivant dans la stratégie de « Business Intelligence » adoptée par l’entreprise : elle consiste à étudier la relation client pour mieux la comprendre. Les techniciens de gestion d’entreprise l’appellent aussi « vision du client à 360° ». Son but: segmenter la clientèle de manière pour apporter des réponses personnalisées à chaque type de profil.

Le renseignement industriel nécessite des investissements technologiques pour compiler et harmoniser les données. Mais que se passe-t-il ensuite ? L’entreprise a le choix : elle peut utiliser des algorithmes ou des scientifiques professionnels pour analyser les données.

Embaucher un analyste, même à temps partiel, coûte cher. En revanche, les outils gratuits ou à faibles coûts sont facilement accessibles sur internet. La PME peut s’offrir ce qu’on appelle également : « Business Intelligence automatisée ». Son rôle :

  • effectuer un nouveauciblage publicitaire en relançant les visiteurs qui sont venus plusieurs fois sur son site
  • suggérer aux clients des produits, les célèbres recommandations
  • offrir un contenu personnalisé aux clients.

L’exploitation des données à des fins marketing

La multiplication des données sur internet encourage des entreprises à exploiter cette mine d’or pour augmenter leurs parts de marché et augmenter le volume de leurs ventes.

Le géomarketing, une technique qui a le vent en poupe

Parmi les récentes techniques d’exploitation des données pour le marketing, il y a la géolocalisation. Grâce aux dernières technologies, notamment celles usitées par les applications des smartphones, les entreprises peuvent envoyer des publicités ciblées. A priori, la Cnil pourrait s’opposer à cette stratégie, mais elle n’a pas agi. La commission nationale de l’information a considéré que les entreprises ont le droit de mieux connaître leurs clients afin de définir correctement des actions commerciales. Mais il serait inexact de croire que toutes les entreprises ont le droit d’utiliser les données personnelles des consommateurs comme et quand elles le souhaitent. En effet, ces données sont protégées par la loi Informatique et Liberté. La nuance est subtile…

Le fait de recourir à la segmentation géographique ne doit pas placer le consommateur dans une position d’exclusion automatique d’un service ou d’un contrat, ni le priver d’un droit dont bénéficient tous les membres d’un segment. En d’autres termes, la géolocalisation et le type de profil dans lequel un client a été classé, ne doivent pas servir de prétexte pour opposer un refus de vente à un consommateur par exemple.

En outre, l’utilisation d’un procédé de géolocalisation exige l’adoption de précautions spécifiques : il est notamment recommandé de laisser aux consommateurs la possibilité d’accepter ou de refuser la localisation via leur terminal. De plus, les entreprises ont l’obligation d’informer clairement les clients que leur appareil pourrait être localisé.

La segmentation

Autre procédé utilisé : la segmentation. Elle permet de regrouper des consommateurs, non par secteur géographique, mais par type de profils. Pour des raisons évidentes, certaines données sont exclues d’emblée. Il n’est permis ni de les collecter, ni de les exploiter. Ce sont : les origines raciales, l’appartenance à un syndicat, les opinions politiques, l’état de santé.

En bref, géolocalisation et segmentation ne doivent pas conduire à la ségrégation.En outre, les entreprises utilisant à ces outils doivent au préalable informer la Cnil, préciser l’intégralité des données collectées et informer les consommateurs de leurs droits. C’est ce qu’exige l’article 32 de la loi Informatique et Liberté. Les clients doivent aussi être clairement informés non seulement du fait qu’ils sont localisés, mais aussi de l’usage qui peut être fait de ces informations de géolocalisation. Ils ont le droit de s’opposer.

Les limites du Data mining en marketing

L’exploitation des données à des fins marketing est utile. Mais, il faut avoir conscience de ses limites.

Tout d’abord, le choix des méthodes de traitement des données exerce une forte influence sur les résultats obtenus : les méthodes analytiques sont mises en œuvre avec une certaine subjectivité de la part des analystes. Ce biais est également présent dans les algorithmes, car celui qui choisit les algorithmes et les paramètres peut influencer (volontairement ou non) les résultats. Ce biais peut survenir même quand l’entreprise fait appel à un collaborateur extérieur, un expert en « data mining ».

Ensuite, la mise en forme et la visualisation effectuées sur la base de données sont effet très importants : afin d’avoir des résultats probants, il est essentiel d’écarter les données superflues pour ne conserver que les pertinentes. En dernier lieu, il ne faut pas négliger la qualité de l’analyse : seul un traitement poussé des données combiné avec une véritable réflexion permet d’exploiter les informations collectées de manière intelligente pour déterminer des objectifs ambitieux, cohérents et atteignables. Bref, les données ne veulent rien dire en soi. L’action de l’humain qui contribue à leur exploitation est déterminante.