Critiques du Web² (1/4) : Quelles données libère-t-on ?

Le 16 septembre 2009 Hubert Guillaud

Oui, les données valent de l’or. C’est aussi comme cela qu’on peut lire le Web à la puissance deux (Web²) de Tim O’Reilly et John Battelle. Mais si c’est effectivement le cas, si nous sommes tous assis sur un capital dont on mesure mal l’exploitation qui peut en être faite, pourquoi faudrait-il les libérer ? [...]

Image : Illustration de Boris Müller pour le festival de littérature allemand de 2006 montrant les relations entre les lettres dans un poème, mis en avant par l’australien Andrew Vande Moere, l’auteur du cultissime blog infosthetics sur l’esthétisme de la visualisation de données, pour un article de PingMag sur la beauté de cette nouvelle discipline de représentation de l’information.

Un des présupposés de l’article d’O’Reilly et Battelle est que les données que produisent les dispositifs sociotechniques, depuis les bases de données commerciales jusqu’aux réseaux de capteurs, en passant par les logs de sites web et les documents publics, “s’ouvriront” pour permettre à toutes sortes d’acteurs de les exploiter de manières nouvelles : les agréger, les croiser, les analyser, en extraire d’autres significations ou d’autres décisions…

Or l’ouverture des données ne va pas de soi pour les organisations. Et ce ne sont pas seulement des questions de droits ou de vie privée (centrales), mais aussi des questions de conception (politique) et de valeur (économique) des données elles-mêmes. Si les données sont le capital immatériel de demain comme l’expliquent Tim O’Reilly et John Battelle, ou comme l’ont déjà dit Jean-Pierre Jouyet et Levy avant eux, il sera difficile de dire qu’il faut les libérer, c’est-à-dire les ouvrir, les rendre accessible facilement – voir gratuitement. Surtout si demain, leur agrégation, leur compilation, leur croisement appellent à créer de nouvelles données, de nouveaux services et de nouvelles valeurs.

Indéniablement, la question de leur ouverture deviendra à l’évidence un sujet conflictuel. “Libérer” une donnée, c’est la mettre en circulation et bien souvent, en perdre le contrôle, y compris économique. C’est aussi permettre à d’autres de créer à partir d’elle de nouveaux services, de nouvelles valeurs. En contrepartie de quoi ? Dans quelles conditions ? On peut bien sûr montrer que bien souvent, une donnée qui circule et que beaucoup de gens exploitent intelligemment produit plus de bien-être collectif qu’une donnée soigneusement enfermée dans son silo, mais la plupart des acteurs n’intègrent pas (encore ?) leur contribution au bien-être collectif dans leurs comptes…

Certes, on peut souhaiter qu’elles n’appartiennent plus seulement à ceux qui les produisent ou les collectent, puisqu’elles sont pour l’essentiel composées de nos identités et de nos activités. Mais n’est-ce pas un vain rêve ? Un miroir aux alouettes dont les reflets nous empêchent de regarder le problème plus en profondeur ?

Il y a au moins deux limites intrinsèques à la vision de Battelle et O’Reilly :

> Il n’existe pas de données brutes

Toute donnée est construite par le système qui la produit. Un capteur est installé à un endroit précis ; il mesure certains paramètres et pas d’autres, avec une certaine marge d’erreur, à une certaine fréquence. Un document est rédigé dans une langue donnée et avec un certain langage, administratif, scientifique, commercial, littéraire… Deux entreprises faisant le même métier collecteront des données différentes ; elles définiront des segments différents : par exemple, on pourra classer un âge dans les segments de 5 ans (15-20 ans, 20-25…) ou beaucoup plus larges (”jeune”, “actifs”, “vieux”…). Toutes les données auront du mal à discuter entre elles, quels que soient les progrès de la science des algorithmes ou de la sémantique

> On ne libère jamais tout

Quelles sont-elles ces données qu’on appelle à libérer ? Desquelles parle-t-on ? Desquelles ne parle-t-on pas ? Amazon par exemple libère certaines données via ses interfaces de programmation (API), oui. Celles qui permettent à d’autres services de construire des services depuis ses données à son propre profit… Amazon ne libère pas les données de ses clients. N’importe qui n’a pas accès aux livres que vos Kindle ont achetés. Nous n’avons pas non plus accès aux chiffres de ventes des produits que propose le commerçant. Pas plus que nous n’avons accès aux données de visites (les logs) de son site marchand. Où sont les données des plaintes ou des demandes de retrait de titres qu’il reçoit et qui justifient certains de ses reclassements de titres par exemple ?

S’il y a de plus en plus de lois et/ou de décisions politiques pour libérer les données publiques – et encore, les exemples britanniques et américains demeurent pour l’instant isolés -, les entreprises, elles, n’ont pas cette contrainte et ne libèreront que ce qui leur semble soit non stratégique, soit plus probablement utile à l’émergence d’écosystèmes de services qui leur profiteront en dernier ressort.

La libération des données qu’appellent O’Reilly et Battelle ressemble certes à un horizon, une nouvelle frontière, mais elle n’a rien de magique en soi. Le plus dur assurément sera de créer les conditions de la libération des données pour ne pas que ces promesses ne se transforment en un vaste Data-entertainment, un “grand spectacle des données”, une industrie du divertissement autour des données, comme le propose Facebook.

—

> Article initialement publié sur Internetactu, sur lequel vous pouvez retrouver la suite de cette critique du Web²

La Fürher du Poitou

Sarkozy veut Hadopi, nous voulons la Liberté

Facebook♥ Twitter♥ ♥ RSS

Un
commentaire Fermer

Laisser un commentaire

Derniers articles publiés

Une Vive Internet! Inédit • 14 décembre 2012

[Infographie] 10 ans de Creative Commons

par Sabine Blanc

Cette semaine, Creative Commons fête ses dix ans dans le monde entier. Une décennie d'alternative à une vision maximaliste de la propriété intellectuelle qui a su conquérir le grand public. Owni, un des rares médias en CC en France, vous retrace cette histoire en une infographie interactive.

Twitter Facebook 188

creative commons, droit d'auteur, Lawrence Lessig

Graphisme Chronique • 14 décembre 2012

Charte de confidentialité : des icônes pour informer

par Geoffrey Dorne

Personne - ou presque - ne lit les politiques de confidentialité. Pour simplifier les choses et rendre compréhensible ce que fait chaque site avec vos données, designers, citoyens et experts soutenus par la fondation Mozilla ont mis en place une liste d'icônes. Tour d'horizon de l'initiative.

Twitter Facebook 223

Art, CGU, création, design, graphisme, icone, icônes, picto, pictogramme, vendredi-graphism, vie privée

droit Chronique • 14 décembre 2012

Les Creative Commons hackent le droit d’auteur !

par Lionel Maurel (Calimaq)

Toute la semaine, ce sont les dix ans des Creatives Commons. L'occasion pour notre chroniqueur Calimaq de revenir sur le projet : réussites, limites et défis à relever.

Twitter Facebook 344

#cc10, creative commons, droit d'auteur, licences libres

Une Vive Internet! Édito • 13 décembre 2012

Offrez-vous un Owni

par Media Hacker

Des milliers de témoignages de réconfort et de soutien, et beaucoup évoquant le souhait de participer financièrement. Il nous reste à déterminer si cette somme de bonnes intentions peut effectivement transformer notre modèle économique et faire vivre le média.

Twitter Facebook 602

42, financement, Internet, médias, owni

Presse Enquête • 13 décembre 2012

Google : chêne ou roseau?

par Andréa Fradin

Google et les éditeurs de presse belges ont enfin trouvé un accord. Pour Le Monde, cela veut dire que "la presse peut faire plier Google" et que les titres français peuvent espérer profiter d'un effet "boule de neige". En fait, c'est un poil plus compliqué. Explications.

Twitter Facebook 78

belgique, Copie presse, éditeurs de presse, Google, IPG, Laurent Joffrin, lex google, médiation

L'auteur

Hubert Guillaud

Suivre sur Twitter

En savoir +

Tags pour cet article:

bookmarking, coopération, données publiques, identité numérique, linkjournalism, opendata, web²

Du même auteur:

Open Data, un premier bilan français

Six mois après le lancement du portail gouvernemental de libération des données publiques Etalab, de nombreuses initiatives ont fleuri partout dans l'hexagone. Ces projets foisonnants permettent à Hubert Guillaud de dresser un premier bilan de la situation de l'Open Data en France sur Internet Actu, dans un papier que nous republions ici.

210

Sceptiques des TICE

Présentées par certains comme la dernière panacée, les Technologies de l'Information et de la Communication pour l'Enseignement ne font pas l'unanimité. Exemples aux États-Unis.

104

Loisir: bricolage (numérique)

Dans une société numérique où les objets de consommation ne sont pas toujours conçus pour interagir entre eux, comment adaptons-nous nos usages? L'ethnographe Philip Ely a étudié ce do-it-yourself moderne.

Est-ce que la technologie désurbanise la ville ?

Retour sur un des thèmes abordés dans le cadre de la conférence Lift France. La sociologue et économiste américaine Saskia Sassen a, entre autres, exposé son point de vue.

213

Le papier contre le numérique

Pour certains, la cause est entendue : en changeant de support, nous avons perdu de notre capacité à nous plonger dans de longs textes. Un point de vue trop simpliste, comme en témoignent les analyses présentées dans ce texte.

324

Voir tous les articles