Rapport Tessier : échanges de bons procédés ?

Le 23 janvier 2010

Paru le 12 janvier dernier, le rapport Tessier sur la “numérisation du patrimoine écrit” était attendu comme le loup blanc, suite aux polémiques déclenchées cet été par l’annonce de négociations entre Google et la Bibliothèque nationale de France On notera immédiatement que le titre de ce rapport est surprenant. Frédéric Mitterrand avait en effet confié le [...]

Paru le 12 janvier dernier, le rapport Tessier sur la “numérisation du patrimoine écrit” était attendu comme le loup blanc, suite aux polémiques déclenchées cet été par l’annonce de négociations entre Google et la Bibliothèque nationale de France

On notera immédiatement que le titre de ce rapport est surprenant. Frédéric Mitterrand avait en effet confié le 15 octobre 2009 à Marc Tessier le soin de coordonner une “commission sur la numérisation des fonds patrimoniaux des bibliothèques“, avec pour but essentiel de statuer sur l’opportunité d’un tel partenariat.

Le rapport a largement dépassé le champ des “fonds patrimoniaux”, ainsi que celui des seules bibliothèques, pour proposer une profonde modification du paysage de la numérisation en France, ainsi que des rapports entre initiative publique et privée en la matière. De ce point de vue, c’est plutôt une surprise et on a l’impression que la question de Google a servi de “cheval de Troie” pour s’introduire dans un autre débat. Cette extension de la portée des préconisations présente l’intérêt de traiter la question de manière globale ; elle peut aussi conduire à un certain mélange des genres…

(Curtain of books. Par timtom.ch. CC-BY-NC-SA. Source : Flickr)

Je ne vais pas me lancer dans une analyse complète des propositions de ce rapport (voyez les nombreux commentaires déjà parus et notamment celui d’Olivier Ertzscheid sur Affordance, avec qui je partage beaucoup de vues… mais pas toutes !).

Je voudrais me concentrer sur les deux propositions du rapport qui me paraissent les plus importantes, à savoir :

  • l’idée de conclure “un partenariat avec Google Livres par échange de fichiers numérisés sans exclusivité sur les fichiers échangés” selon un principe “Un livre pour un livre“, par le biais d’un accord qui viserait “non pas à faire prendre en charge l’effort de numérisation mais à le partager, en échangeant des fichiers de qualité équivalente et de formats compatibles” ;
  • la proposition d’investir la BnF d’une mission pour “faciliter la mise en oeuvre d’une chaîne de numérisation de masse, non seulement des oeuvres hors droits, mais aussi des oeuvres sous droits” en utilisant pour ce faire une partie des sommes allouées dans le cadre du grand emprunt. Cette réorientation interviendrait “dans un cadre contractuel avec les éditeurs et les représentants des ayants droits” et prendrait la forme d’une “numérisation de masse des ouvrages collectés au titre du dépôt légal” qui pourraient viser “les oeuvres épuisées” ou “des oeuvres orphelines“.

Ces préconisations ont trait à la forme que doivent prendre les partenariats public-privé en matière de numérisation. Elles se présentent toutes deux sous la forme d’un “échange de bons procédés” entre le secteur public et le secteur privé. C’est précisément l’équilibre de ces échanges que je voudrais questionner dans ce billet.

En effet, ces deux pistes me paraissent intéressantes sur le principe, car elles redonnent l’initiative au secteur public en matière de numérisation à un moment où l’on aurait pu craindre qu’un “décrochage” se produise, notamment vis-à-vis de Google. La manne du grand emprunt est pour beaucoup dans ce redéfinition des règles du jeu. Mais dans les deux cas, la manière dont le rapport envisage de concrétiser ces propositions me paraît porteuse de réels risques de déséquilibre.

En ce qui concerne l’échanges de fichiers avec Google, le déséquilibre pourra résulter de la persistance d’exclusivités de fait au profit de Google Book au terme de l’échange de fichiers, malgré l’absence d’exclusivité inscrite en droit. Dans le cas de la numérisation des ouvrages sous droits, c’est l’absence de contreparties envisagée en échange de l’investissement public consenti en faveur de la numérisation qui est préoccupante et qui risque de provoquer un déséquilibre en termes d’accès aux oeuvres.

I) L’échange de fichiers numérisés : une symétrie impossible ?

J’ai eu peu de mal à avaler cette proposition qui m’a paru assez absurde au premier abord et très dangereuse.

de son côté, Olivier Ertzschied sur Affordancey croit dur comme fer” :

Je reste cependant convaincu qu’atteindre une masse critique full-text francophone me semble une urgence et un préalable. Et que les modalités décrites de l’échange de fichiers me semblent être l’une des bonnes approches possibles.

Je dois dire que cet argument ne me paraît pas décisif, dans la mesure où le montant des sommes consacrées à la numérisation du patrimoine dans l’emprunt national va permettre de toute façon d’atteindre cette masse critique à brève échéance. C’est sur un autre plan que la stratégie d’échange des fichiers a fini par m’apparaître intéressante, car elle offre une réelle opportunité de lutter efficacement contre les exclusivités imposées par Google dans ses contrats.

… à condition de se montrer extrêmement prudent et de bien cerner en quoi consiste exactement ces restrictions d’usage…

En ce qui concerne les exclusivités, le rapport Tessier est catégorique et sans appel : il rejette les contreparties exigées par Google dans les contrats conclus par les bibliothèques partenaires au motif qu’elles seraient “incompatibles avec leurs missions essentielles“. Ce jugement concerne à la fois l’exclusivité commerciale, l’exclusivité d’indexation des contenus, ainsi que les restrictions d’usage des fichiers numériques diffusés par les bibliothèques. Le rapport insiste aussi à très juste titre sur les faiblesses de ces accords concernant les métadonnées ou la conservation des fichiers, ainsi que sur les risques en terme d’atteinte à la protection de la vie privée du fait de la collecte d’informations personnelles par Google.

C’est un des grands mérites de la commission d’avoir mis en regard ces restrictions par rapport à l’intérêt public et on pourra relever que ces critiques reprennent très largement la position exprimée par l’IABD (Interassociation Archives Bibliothèques Documentation) dans sa déclaration du 7 septembre dernier consacrée au règlement Google. En ce sens, le rapport Tessier rejette les formes d’accords que Google a déjà conclu avec d’autres bibliothèques, y compris celui avec la ville de Lyon.

Parmi les réactions au rapport, j’ai trouvé particulièrement intéressante celle de la bibliothécaire américaine Karen Coyle sur son blog, qui relève que les bibliothèques n’ont jamais su metre en avant leurs vrais atouts face à Google :

Preservation, equality of access, privacy… Google’s program is lacking in all of these areas. The commercial goals of Google and the public goals of a national library are essentially at odds. To me, the main thrust of the report comes from this: “Les bibliothèques françaises – en particulier la BnF – disposent d’atouts importants, qu’il ne faut pas sous-estimer dans le cadre d’une négociation avec un partenaire privé. (p. 17)”. What this says is that libraries have a strong negotiating position with Google (that I think the authors of this report feel has not be fully exploited) because of the incredible value of their holdings. You could say that libraries have a monopoly of their own. Yet they seem to have traded their holdings for fairly meager returns in the contracts with Google.

L’un des atouts de la France par rapport à d’autres pays, c’est de disposer d’un acquis en matière de numérisation, par le biais des 150 000 ouvrages figurant dans la bibliothèque numérique Gallica. L’idée du rapport Tessier consiste à procéder à l’échange de ces fichiers contre d’autres ouvrages figurant déjà dans Google Book Search et issus dans fonds des bibliotèques américaines sur la base d’un principe “Un Livre pour un Livre”, sans aucune exclusivité :

Chaque partenaire resterait libre de disposer des fichiers obtenus par l’échange , dans des conditions transparentes et définies à l’avance.

J’aime assez le côté “prise de judo” de cette formule et la manière dont elle prend Google à son propre piège. Tant que Google prenait en charge les coûts de la numérisation, il pouvait se présenter comme “le good guy” oeuvrant pour l’accès à la connaissance, tout en imposant sans y toucher des restrictions sécurisant son modèle économique pour des décennies. Avec cet échange, c’est la devise “Don’t be evil” elle-même qui est mise à l’épreuve et l’on verra bien jusqu’à quel point le philantropisme de la firme est une légende urbaine ! Je vous recommande de lire à ce sujet l’analyse de Monique Dagnaud “Comment négocier avec Google” :

En offrant une conciliation au moment où les rapports de force et les images se modifient, Marc Tessier joue sans doute habilement. Mais le plus savoureux pourtant demeurent les termes de l’accord envisagé. Que propose-t-il en effet ? Un partage de fichiers sans clause d’exclusivité. Presque du peer-to-peer, la formule chérie de l’Internet, le joyau intellectuel de la culture numérique. « Un accord avec Google pourrait viser, non pas à faire prendre en charge l’effort de numérisation mais à le partager, en échangeant des fichiers de qualité équivalente et de formats compatibles ». Cet effort partagé devrait permettre de lever les restrictions d’utilisation aujourd’hui imposées par Google. Comment réagiront Sergey Brin and Larry Page à cette proposition subtilement ajustée idéologiquement, une offre qui sonne tellement « Google attitude » ?

Le problème, c’est qu’il ne suffit pas de lutter contre les exclusivités en droit pour qu’elle ne persiste pas dans les faits. J’avais déjà eu l’occasion par exemple de montrer dans S.I.Lex que le contrat conclu entre Google et la Bibliothèque de Lyon ne comportait pas de clause imposant une exclusivité d’indexation des contenus, ce qui pouvait apparaître comme une grande avancée. Pour autant il existe un risque réel que cette exclusivité se mantienne dans les faits, dans la mesure où Google maîtrise la solution technique (hosted solution) qu’il installera pour permettre à la bibliothèque de Lyon de diffuser ses fichiers.

Et c’est bien ce qui pose problème avec la solution d’échange préconisée par le rapport Tessier… Séduisante sur le papier, elle paraît très difficile à mettre en place juridiquement et techniquement.

(Book Cell. Par Ferran Moreno Lanza. CC-BY-NC-ND. Source : Flickr)

Lorsque l’on dit que l’échange de fichiers ne doit donner lieu à aucune exclusivité, de quoi parle-t-on au juste exactement ? J’y vois pour ma part trois sens possibles.

Cela signifie en premier lieu qu’aucune exclusivité (commerciale ou d’indexation) ne doit peser sur les fichiers remis par la BnF à Google et diffusés dans Google Book Search, ni aucune restriction à l’usage. Cela signifie ensuite que réciproquement, aucune exclusivité (commerciale ou d’indexation) ne doit peser sur les fichiers récupérés de Google Book Search et intégrés dans Gallica, ni aucune restriction à l’usage. Et enfin, cela signifie que la BnF doit rester libre de pouvoir donner ou échanger des fichiers avec d’autres acteurs (y compris ceux donnés par Google), tout comme Google pourra donner à des tiers les fichiers remis par la Bnf.

Est-on bien sûr que tout cela soit vraiment possible ?

Prenons le premier cas : Google devrait donc permettre aux moteurs de recherche concurrents d’indexer le contenu des ouvrages donnés par la BnF, à l’intérieur même de Google Book (alors que tout le reste est fermé). Comment cela serait-il possible techniquement ? Comment distinguer ce sous-ensemble de la masse de Google Book pour l’ouvrir aux robots des autres moteurs ? Pareillement, les fichiers remis par la BnF devraient pouvoir être récupérés pour un usage commercial à partir de Google Book, ce qui n’est pas le cas à l’heure actuelle du reste de la base. Là encore, même pour un géant de l’information comme Google, cela constitue un sacré défi à relever en terme de gestion des droits !

Second cas : Les fichiers donnés par Google et intégrés dans Gallica devront pouvoir être indexés par les autres moteurs de recherche. Ce serait effectivement une bonne chose, nécessaire à la liberté d’accès à l’information, mais le rapport Tessier montre bien qu’à l’heure actuelle les contenus de Gallica souffrent d’un défaut de visibilité sur l’ensemble des moteurs de recherche en raison de difficultés à faire indexer ses contenus (p. 28) :

Si Gallica est facilement accessible depuis les moteurs de recherche à partir d’une requête avec le nom (le lien vers le site arrive alors en première réponse, quel que soit le moteur de recherche utilisé), ce n’est pas le cas lorsque l’on interroge le moteur à partir d’un titre ou d’un nom d’auteur. Ainsi, une recherche sur « le Rouge et le Noir », présent dans les collections numériques hors droits de Gallica, ne laisse apparaître aucun résultat en provenance de Gallica. La première occurrence de l’ouvrage numérisé vient de Google Livres, qui propose l’accès à l’exemplaire numérisé de la bibliothèque de l’université de Californie (édition de 1866).

Si on veut que l’exclusivité d’indexation ne persiste pas dans les faits à ce niveau, alors il faut trouver une solution à ce problème, sinon l’échange de fichiers de règlera rien à lui seul. Pareillement, il faudra accepter que les fichiers remis par Google puissent être réutilisés librement, y compris à des fins commerciales, à partir de Gallica, sinon cela revient à reconstituer une forme d’exclusivité commerciale.

Enfin, il faudra que chaque partenaire reste libre de pouvoir donner ou échanger des fichiers avec des tiers. Et pour que cette exclusivité ne persiste pas dans les faits, il faudra qu’il le fasse réellement. Du côté de Google, on sait que c’est déjà le cas : la firme remet a déjà remis à certains partenaires (Sony et Barnes & Noble) des masses considérables d’ouvrages du domaine public numérisés par ses soins afin d’étoffer leur catalogue (en se gardant bien de le faire pour Amazon…). Il faudra accepter que Google puisse ainsi disposer des fichiers issus de Gallica. Et du côté de la BnF, il faudra aussi réciproquement se lancer dans de tels échanges de fichiers sous peine de réinstaller dans les faits une forme d’exclusivité. On dira que l’établissement le fait déjà pour Europeana, mais ce n’est pas le cas, car les échanges dans ce cadre se limitent aux métadonnées et non aux documents eux-même. Par ailleurs, si la Bnf échange des fichiers, il faudra se tourner vers d’autres partenaires disposant d’ouvrages numérisés en français. Ceux-ci ne sont pas très nombreux, mais ils existent : il s’agit par exemple de Wikisource, d’Internet Archive ou du projet Gutenberg. Pour que l’absence d’exclusivité sur les fichiers soit vivante, il faudra donc mettre en oeuvre une stratégie globale de dissémination des fichiers.

Ce qui me préoccupe, c’est que le rapport envisage cette absence d’exclusivité de manière abstraite, sans entrer dans le détail pour examiner concrètement ses implications. Par ailleurs, on a pu lire des choses assez troublantes suite à la parution du rapport. Marc Tessier dans une interview donnée au Figaro déclarait :

Pourquoi ne pas échanger avec Google nos fichiers respectifs de livres numérisés dans des conditions économiques équilibrées, prévoyant, entre autres, le partage des recettes liées à la vente croisée de ces fichiers ?

Partage des recettes liées à la vente… Etrange formule… car Google ne fait pas d’exploitation économique directe des fichiers numérisés à partir des ouvrages du domaine public… il ne les vend pas et il les donne même à des partenaires animés d’intention commerciale comme Sony ou Barnes & Nobles. De quel partage des recettes parle-t-on ici alors ? Un pourcentage de la chimérique taxe Google sur la publicité ?

On le voit, si la formule prévue par le rapport Tessier est audacieuse, elle suppose de très fortes garanties pour atteindre son objectif, à savoir la lutte contre les exclusivités contraires à l’intérêt public. Sous peine de quoi, elle se limitera à un trompe-l’oeil qui pourrait s’avérer très dangereux… et aussi bien du point de vue technique que juridique, la symétrie recherchée pourrait bien s’avérer impossible à créer…

II) La numérisation d’oeuvres sous droits sur fonds publics : une insupportable asymétrie ?

Paradoxalement, ce n’est peut-être plus au niveau du partenariat avec Google que se situe l’enjeu essentiel du rapport Tessier. L’affectation de sommes considérables pour la numérisation dans le cadre du grand emprunt change complètement la donne et ôte à Google sa position d’opérateur incontournable. Nul besoin d’aller voir celui qui “rase gratis” – et vous tond au passage la laine sur le dos – quand on a les moyens de construire sa propre échoppe de barbier !

Et après tout, le véritable enjeu de l’affaire Google Book ne s’est jamais réellement situé au niveau de la numérisation des ouvrages patrimoniaux. Les oeuvres du domaine public ne forment qu’une part minime de Google Book Search (1,5 millions d’ouvrage sur plus de 10 millions d’après le rapport). La très grande majorité des titres sont des ouvrages protégés par des droits d’auteur, trouvés “au passage” dans les fonds des grandes bibliothèques américaines partenaires du projet.

Là aussi, le rapport Tessier a le grand mérite d’aborder de front cette question de la numérisation des oeuvres sous droits dans le contexte français. Croire qu’il suffirait de numériser des oeuvres patrimoniales pour construire une alternative à Google Book serait une cuisante erreur. On notera qu’ici aussi, le rapport Tessier converge avec la position de l’IABD (Interassociation Archives Bibliothèques Documentation) qui dans sa déclaration sur le Règlement Google appelait à la mise en place d’une alternative publique réelle portant à la fois sur des oeuvres du domaine public et des oeuvres sous droits. Et l’IABD proposait aussi de mobiliser les fonds de l’emprunt national pour numériser notamment des oeuvres orphelines et épuisées françaises.

D’aucuns avaient jugé cette position désolante, mais force est de constater que c’est bien cette voie que propose à présent d’emprunter le rapport Tessier.

Il est en effet préconisé que la BnF soit investie de la mission de numériser massivement les ouvrages sous droits entrés au titre du dépôt légal dans ses collections. Le rapport souligne que juridiquement, c’est déjà une chose possible en vertu d’une exception votée dans la loi DADVSI en 2006 qui permet aux organismes attributaires du dépôt légal de numériser et de diffuser sur place les oeuvres protégées ayant rejoint par ce biais leurs collections. De manière audacieuse, le rapport propose de s’appuyer sur ce premier jalon légal pour aller plus loin et poser un cadre contractuel en partenariat avec les éditeurs et les autres titulaires de droits pour organiser la diffusion en ligne de ces oeuvres numérisées grâce à l’emprunt. Le rapport ajoute aussi de manière très pertinente que ce partenariat public-privé pourrait porter en premier lieu sur des oeuvres épuisées (qui ne sont plus disponibles commercialement) ou des oeuvres orphelines (dont on ne peut identifier les titulaires de droits) :

L’ensemble ainsi créé constituerait une base numérisée significative et s’avérerait particulièrement intéressant à exploiter, notamment pour ce qui concerne les oeuvres épuisées. Les ouvrages que les éditeurs ne souhaiteraient pas nécessairement publier à nouveau sous format papier pourraient ainsi trouver une exploitation nouvelle, rémunérée et non exclusive, sous format numérique. Pour le public, la base consultable s’en trouverait considérablement élargie (p. 24).

Enfin, par son positionnement à la frontière du champ patrimonial et du secteur sous droits, Gallica serait naturellement appelée à jouer un rôle de plate-forme de diffusion et de valorisation des oeuvres orphelines, à partir du moment où le code de la propriété intellectuelle permettra les utilisations numériques de ces documents (p. 25).

Ici encore, je ne peux qu’applaudir à ces propositions, mais je me montre très inquiet sur la manière dont cette forme de concours des initiatives publique et privée est envisagée et sur l’insupportable asymétrie qui pourrait en résulter en terme d’accès à la culture.

(Book Sculpture. Par Gwen’s River City Images. CC-BY-NC-SA. Source : Flickr)

Car vous avez bien lu comme moi, ces oeuvres épuisées ou orphelines dont la numérisation serait entièrement prise en charge sur fonds publics auraient seulement vocation d’après le rapport à faire l’objet d’une exploitation commerciale et donc à être vendues. Voyez les deux citations ci-dessus : pour les épuisées, il est dit “exploitation nouvelle, rémunérée“  ; pour les orphelines “plateforme de diffusion et de valorisation“.

Nulle part dans le rapport Tessier, il n’est envisagée que des contreparties en terme d’accès public soient exigées en échange de cet effort considérable consenti par la puissance publique et financé à grand renfort de l’argent le plus public qui soit : celui du grand emprunt national. Cette asymétrie est d’autant plus surprenante qu’une semaine auparavant, le rapport Zelnik avait de son côté formulé des propositions plus équilibrées dont j’avais parlé dans S.I.Lex. Il était en effet suggéré qu’en contrepartie d’une augmentation des aides de l’Etat allouées aux éditeurs pour la numérisation de leurs fonds, des conditions préférentielles d’accès puissent être négociées :

En contrepartie de cet effort, l’État pourrait négocier avec les éditeurs pour que les oeuvres ainsi numérisées puissent être utilisées à des conditions préférentielles par l’Éducation nationale.

L’octroi d’aides à la numérisation des catalogues devrait avoir des contreparties pour les pouvoirs publics en termes d’usages non commerciaux, notamment dans le cadre de la politique de prêt des médiathèques, qui doit elle aussi relever le défi de la numérisation, mais aussi au sein du système éducatif, où les oeuvres numérisées avec l’aide du CNL pourraient être exploitées à des conditions préférentielles.

Or dans le rapport Tessier, on ne parle plus cette fois seulement d’aide à la numérisation mais d’une prise en charge totale du coût par la personne publique. Et celle-ci ne serait consentie en échange d’aucune contrepartie en terme d’accès public ? Voilà qui dénote une curieuse conception des partenariats public-privé ! Et la désagréable sensation que là encore, on risque de “raser gratis”…

Surtout qu’il est bien difficile de croire que toutes les oeuvres épuisées ou orphelines sont destinées à reprendre une carrière commerciale sous forme numérique. Prenons par exemple le corpus de la poésie du 20ème siècle. Se lancer dans un programme global de numérisation de ce corpus aurait un très grand intérêt culturel, mais cela signifie-t-il que chaque poème devrait être vendu à la pièce sous forme numérique ? Cela aurait-il même un sens d’un point de vue économique ? Il existe d’ores et déjà des formes de concours des initiatives publique et privée qui s’appuie sur d’autres modèles économique beaucoup plus équilibrés.

Voyez par exemple le portail Persée de numérisation des revues en sciences humaines et sociales mis en place par le Ministère de l’Enseignement supérieur. Des accords avec les éditeurs permettent la numérisation et la diffusion à titre gratuit de revues des origines aux années 2000 environ, dans la mesure où la personne publique en assume les coûts. Les éditeurs commercialisent de leur côté les numéros les plus récents sur d’autres plateformes et un système de barrière mobile assure le versement des archives en accès gratuit dans Persée.

Pourquoi un tel modèle équilibré ne pourrait-il pas voir le jour en matière de livres numériques, dans les domaines où la valeur commerciale du rétrospectif est moins forte ? Just think about it !

Sans aller jusque là, il reste difficilement concevable que la numérisation des oeuvres sous droits, épuisées ou orphelines, puissent s’effectuer sur financement public sans que des contreparties en terme d’usage ou d’accès soient exigées en retour.

Notons à ce sujet que l’IABD (Interassociation Archives Bibliothèques Documentation) est là aussi intervenue dans une récente déclaration sur les oeuvres orphelines qui insiste sur l’équilibre à atteindre entre le respect des droits et l’accès du public. Le rapport Tessier confirme qu’une loi sur les oeuvres orphelines est bien en préparation pour l’année 2010 et il faudra veiller de près à ce que le dispositif qui se mettra en place fasse toute sa place à cette idée d’équilibre.

Le rapport Tessier a été rendu, mais c’est maintenant que les chose sérieuse commencent. Il indique bien des directions qui peuvent s’avérer de bons procédés pour avancer sur la question de la numérisation et tirer partie de l’exceptionnelle opprotunité qui so’uvre grâce au grand emprunt. Mais avant que ces pistes ne deviennent réellement des “échanges de bons procédés”, il y a encore beaucoup à faire…

Et la vigilance reste plus que jamais de mise… car l’équilibre et la réciprocité des rapports entre le public et le privé ne sont jamais acquis…

Un billet publié à l’origine sur le blog S.I.Lex




Laisser un commentaire

Derniers articles publiés