Apostille sur le partenariat BnF/Microsoft

Jeudi dernier, 7 octobre, a été annoncée la signature d’un partenariat entre Microsoft et la Bibliothèque nationale de France, ayant pour but d’améliorer l’indexation des contenus de la bibliothèque numérique Gallica par le moteur de recherche Bing.

Depuis, la nouvelle a été reprise mainte et mainte fois dans les médias, à longueur de gloses du communiqué de presse, avec pour seul effet de nous faire comprendre un peu mieux ce que signifie le mot « infobésité » (exemple de commentaire particulièrement oiseux…).

Ne voulant point contribuer à aggraver ce phénomène pénible, je voudrais aller directement à l’essentiel pour essayer de cibler un élément que je n’ai vu apparaître nulle part encore et qui a trait à l’une des conséquences potentielles de cet accord.

Le partenariat ne porte pas sur la numérisation des collections elles-mêmes (domaine que Microsoft a abandonné en 2008), mais uniquement sur l’amélioration de l’indexation des contenus de Gallica, en se limitant aux ouvrages libres de droit. Il est conclu pour une durée reconductible d’un an, ne comporte pas de dimension financière et – voilà le plus important – ne contient aucune clause d’exclusivité. Dixit le communiqué :

Microsoft est libre de lier des accords du même type avec d’autres bibliothèques, tout comme la BnF avec d’autres acteurs du secteur des technologies de l’information et de la communication.

Rappelons que l’exclusivité d’indexation des contenus est l’un des points les plus sensibles des partenariats public/privé de numérisation. C’est en effet une des contreparties imposées par Google aux bibliothèques qui signent des accords avec lui. Ces contrats prévoient que les bibliothèques se voient remettre un exemplaire numérique des collections confiées à Google qu’elles sont libres de stocker et de diffuser, mais à la condition d’empêcher les robots des moteurs de recherche concurrents de Google de les indexer.

Déformation du texte. Par Philippe Streicher. CC-BY-NC-SA. Source : Flickr

Voici un exemple de formulation de cette clause telle qu’on la trouve dans les contrats de l’université de Californie ou de Michigan (rendus publics) :

University shall implement technological measures (e.g. through use of the robots.txt protocol) to restrict automated access to any portion of the University Digital Copy or the portions of the University Website on wich any portion of the University Digital Copy is available.

Cette restriction, qualifiée d’eugénisme documentaire par Olivier Ertzscheid, constitue une atteinte grave à la liberté d’accès à l’information et permet à Google de s’attribuer de manière déloyale un avantage certain sur ses concurrents.

Il est difficile de savoir quel est le contenu des accords signés par Google avec les bibliothèques européennes, dans la mesure où des clauses de confidentialité en empêchent la communication (sauf à Lyon), mais j’avais pu me rendre compte en épluchant attentivement la communication de la Bibliothèque nationale d’Autriche que celle-ci avait vraisemblablement accepté à nouveau l’exclusivité d’indexation dans la contrat qu’elle a signé cet été.

A la différence de ces accords, le partenariat signé entre la BnF et Microsoft ne comporte donc pas de clause d’exclusivité. Il s’inscrit en cela d’une certaine manière dans la suite du Rapport Tessier (vous vous souvenez ?), qui avait lui aussi fortement critiqué le principe de l’exclusivité d’indexation :

Les accords passés par Google prévoient toujours que les autres moteurs de recherche ne pourront pas accéder aux fichiers numérisés par lui pour les indexer et les référencer. Autrement dit, cette exclusivité se traduit, concrètement, par l’absence d’indexation et de référencement du texte des livres par d’autres moteurs de recherche. Seules les métadonnées, généralement produites par les bibliothèques partenaires, sont accessibles aux moteurs, ce qui réduit considérablement la visibilité sur Internet des fichiers exploités par les bibliothèques et fait peser un lourd handicap sur les bibliothèques numériques que celles-ci pourraient vouloir développer de façon autonome. On peut comprendre les motivations de Google, qui prend à sa charge financièrement et techniquement les opérations de numérisation, et souhaite, en contrepartie, bénéficier d’une exclusivité sur ce contenu numérisé, lui permettant d’étendre sa base de recherche d’indexation et de rémunération. Mais cela revient aussi à permettre à un acteur en position dominante sur le « marché » de la recherche d’information et de l’accès aux contenus numériques de renforcer cette position dominante.

Beaucoup de commentateurs de l’accord BnF/Microsoft ont cherché un lien avec Google et avec la numérisation, sans véritablement réussir à en établir un (voyez ici, et surtout ).

S’il y en a un, il est indirect et il tient justement à cette question de l’exclusivité d’indexation.

La BnF s’est engagée à ce que Microsoft puisse accéder aux contenus de Gallica.

Dans la mesure où Google impose à ses bibliothèques partenaires une exclusivité d’indexation, le fait d’avoir signé un accord de cette sorte avec Microsoft rend en toute logique impossible à présent pour la BnF de signer un partenariat de numérisation avec Google, sauf à ce que celui-ci consente de revenir sur l’un des points les plus importants de sa stratégie.

La solution alternative préconisée par le Rapport Tessier, à savoir l’échange de fichiers entre la BnF et Google, devient également très difficile à mettre en oeuvre (du moins encore plus qu’avant).

C’est vrai tant que durera le partenariat avec Microsoft, c’est-à-dire un an à compter du lancement du moteur Bing en France.

PS : la semaine prochaine, c’est promis, je vous parle d’autre chose que de Google Book !



3 réflexions sur “Apostille sur le partenariat BnF/Microsoft

  1. Guillaume Champeau a pareillement insisté sur la clause de non-exclusivité du présent accord avec Microsoft.
    En revanche, il n’a pas vu l’ obstacle potentiel que cela crée à un partenariat ultérieur avec Google.

  2. @ Calimaq : bonjour, vous écrivez « Il est difficile de savoir quel est le contenu des accords signés par Google avec les bibliothèques européennes, dans la mesure où des clauses de confidentialité en empêchent la communication (sauf à Lyon) ». Cette affirmation mérite d’être nuancée pour la France : tous les accords français engageant une institution publique sont des documents administratifs au titre de la loi de 1978 sur l’accès au document administratif. Il n’y a pas de clause de confidentialité qui tienne…
    C’est un document administratif non nominatif, dont la communication est de droit. Il suffit de le demander au titre du droit d’accès à l’institution publique signataire. Si refus, saisine CADA, et communication in fine…

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.