Vous êtes ici
Valeur des données à l’ère des data-driven business models. Partie 2
Posté le 16/02/2016 par Henri Isaac
Dans un précédent billet de ce blog, la question de la valeur des données a été présentée comme le résultat d’un processus de production complexe. En effet, la collecte de données brutes à elle seule ne suffit pas à créer une quelconque valeur. Ceci est d’autant plus vrai, qu’une partie de la valeur ne réside pas dans la donnée elle-même, mais dans les métadonnées associées aux données.
Mieux, la valeur ne dépend pas de cette première combinaison mais de l’extraction de la valeur par le biais de traitements algorithmiques et de processus de restitution et de valorisation aptes à créer du sens pour leurs utilisateurs (entreprises ou clients).
Ce cadre général d’analyse nécessite d’être précisé tant, chacune des étapes de la chaîne de valeur de la donnée, comporte une multitude de dimensions qui influencent l’extraction de la valeur.
Dans ce billet, nous focalisons notre propos sur les différents types de données à disposition d’une entreprise et potentiellement utilisables pour créer de la valeur.
La nature des données utilisables dans le processus de création de valeur est large et les enjeux associés le sont également[1]. Le régime de production des données a considérablement évolué ces dernières années, puisqu’aux données personnelles classiques, viennent désormais s’ajouter des données produites automatiquement par différents dispositifs numériques : objets connectés, robots, capteurs autonomes.
Données personnelles & traces
En outre, les données personnelles des utilisateurs et/ou des clients différent des traces numériques liées aux usages même si dans la pratique certaines traces peuvent entrer dans le périmètre juridique des données personnelles, comme l’adresse IP. Du point de vue juridique, une donnée personnelle est définie en droit français[2] comme « … une donnée à caractère personnel toute information relative à une personne physique identifiée ou qui peut être identifiée, directement ou indirectement, par référence à un numéro d'identification ou à un ou plusieurs éléments qui lui sont propres. Pour déterminer si une personne est identifiable, il convient de considérer l'ensemble des moyens en vue de permettre son identification dont dispose ou auxquels peut avoir accès le responsable du traitement ou toute autre personne ».
Cependant, les données issues des activités d’usage (d’un dispositif numérique en ligne ou d’un objet connecté par exemple) ne sont pas toujours des données personnelles, mais des traces liées à l’usage, ce que d’aucuns appellent l’ombre numérique[3]. Nous les dénommeront « shadow data ».
Dans cette catégorie, il faut distinguer les données explicites issues des transactions (historiques d’achats, de paiement, d’usage, etc.) des données implicites issues des dispositifs techniques eux-mêmes (données de logs, données techniques, etc.).
Ces données sont nécessaires à la bonne exécution opérationnelle de ces dispositifs numériques ou connectés. Elles permettent le pilotage de la performance de ces mêmes dispositifs. Dès lors, ces données ne peuvent être strictement considérées comme des données personnelles dans la mesure où elles sont nécessaires à la bonne exécution du service. Leur suppression dégraderait la qualité du service. Il en va de même sur les historiques d’achats des clients qui sont à la base de la gestion de la relation du client et des programmes relationnels.
Données contextuelles
Les données contextuelles sont issues de l’environnement d’une transaction ou d’un échange (d’informations ou tout autre type d’échanges). Elles ne concernent ni l’utilisateur directement, ni l’échange lui-même, mais renseignent sur le contexte (localisation, temporalité, caractéristiques de l’environnement). Elles peuvent parfois être une composante des méta-données[4].
Elles peuvent également provenir de dispositifs interconnectés par le biais de capteurs, comme dans le cas de la domotique où des dispositifs connectés peuvent générer des données pour produire des services contextualisés[5] (Context Aware Services[6]). L’utilisation des données de contexte est la base d’une personnalisation situationnelle qui accroît la logique d’hyper-personnalisation.
Données collaboratives
Une catégorie de données plus spécifiques provient des interactions sociales des individus sur des informations ou dans des échanges sur différents types d’espaces numériques (réseaux sociaux, messageries). Elle sont le fruit d’une collaboration volontaire sur les informations elles-mêmes. Il en va ainsi des activités de taggage de photos sur les réseaux sociaux où les personnes par des actions sur ces informations produisent au travers d’une interaction des données supplémentaires à l’information sans qu’elles puisent strictement être considérées comme des métadonnées. Les données ajoutées enrichissent la donnée primaire grâce à une autre donnée. On pense également aux activités de partages de signets ou de favoris qui produisent des données mutualisées créant des catégories par agrégation.
Données automatiques
A ce type de données issues d’interactions entre individus, viennent s’ajouter des données produites par les objets connectés de plus en plus nombreux. S’il existe une typologie large d’objets connectés, une grande partie des données produites le seront automatiquement par le biais de capteurs. Ainsi la poubelle connectée génère elle-même des données qui mesurent son remplissage, ces données sont utilisées pour déclencher une alerte pour procéder à son traitement. Ce sont donc des données automatiques produites par les objets eux-mêmes qui viennent enrichir la masse de données utilisables pour créer de la valeur.
Données complémentaires : second party data & third party data
Toutes ces données peuvent être complétées par des données provenant d’autres acteurs dans l’échange. Dans le cas du marketing digital, de nombreuses données viennent s’ajouter aux données de l’entreprise. Ainsi dans des campagnes de publicité en ligne (online display), l’annonceur peut ajouter des données de l’éditeur (second party data) auprès duquel se déploie sa campagne et il peut y ajouter des données de tiers (third-party data). Le processus de création de valeur combine dès lors de nombreuses données : personnelles, contextuelles, secondaires et de tierces parties.
En synthèse, le processus de création de valeur mobilise potentiellement une variété de données de natures différentes aux enjeux économiques et juridiques différents. Le graphique 1 résume cet ensemble de possibles.
Graphique 1 : Typologie des données et processus de création de valeur
Quel que soit le type de données et leurs combinaisons, une partie de la valeur, sinon l’essentiel dans certains services numériques, est créée non pas par les données elles-mêmes, mais par l’exploitation des métadonnées associées.
C’est l’objet du prochain billet de cette série sur les data-driven business models.
[1] Voir, Cigref, (2015), L'économie des données personnelles : les enjeux d'un business éthique, octobre, www.cigref.fr/wp/wp-content/uploads/2015/11/CIGREF-Economie-donnees-perso-Enjeux-business-ethique-2015.pdf
[2] Article 2 de la Loi Informatique & Liberté
[3] Voir https://myshadow.org, voir également : A Coutant, T Stenger (2010), « Pratiques et temporalités des réseaux socio-numériques : logique de flux et logique d’archive », MEI-Médiation et information
[4] Comme dans le cas d’une photo pour laquelle un smartphone ajoute automatiquement dans le fichier de métadonnées EXIF les données de localisation et l’heure de la prise de vue
[5] Des services combinant des données de localisation du véhicule, de trafic routier en temps réel, météorologiques, de destination sont typiques de cette catégorie de services.
[6] Voir par exemple Philip T. Moore and Hai V. Pham, (2015), « Personalization and rule strategies in data-intensive intelligent context-aware systems », The Knowledge Engineering Review, Volume 30, Special Issue 02, March, pp. 140-156.