Tout est dans tout (y compris Google Books dans Europeana…)

La semaine dernière, lors du congrès annuel de LIBER (l’association des bibliothèques de recherche européennes) a été lancé un nouveau programme Europeana libraries, qui pourrait entraîner un changement de nature décisif  pour la bibliothèque numérique européenne.

Mais ce qui m’a le plus frappé, en lisant ces annonces, c’est de constater que ce programme va visiblement permettre à certaines bibliothèques européennes, partenaires de Google pour la numérisation de leurs collections, de donner  à Europeana les doubles des fichiers numériques remis par la firme , afin qu’elle les diffuse elle-même.

En cela, Europeana évoluerait vers un modèle proche de celui d’Hathi Trust aux Etats-Unis, cet entrepôt numérique collaboratif des grandes bibliothèques de recherche, qui recueille les fichiers numériques produits par Google afin d’en assurer la préservation à long terme.

Explication… entre les lignes !

Voici ce que l’on trouve sur le site de la Commission européenne pour décrire ce nouveau programme Europeana Libraries (j’ai repris seulement les passages qui me paraissaient importants) :

The Europeana Libraries project will:

1. bring to Europeana the digital collections of some of Europe’s leading research libraries from 11 countries. The content is of the highest quality and is also significant in terms of scale, with some of the largest digital collections in Europe, including extensive collections from Google Books, theses and dissertations from DART-Europe and open-access journal articles via the Directory of Open Access Journals. In total some 5,168,453 pages/images/books and theses/AV clips/articles will be loaded into Europeana as an outcome of Europeana Libraries.

[…]

3. establish systems and processes capable of ingesting and indexing significant quantities of digitised material, including text, images, moving images and sound clips. The outcome will be an efficient and effective library-domain aggregator service for Europeana.

Deux évolutions majeures pour Europeana :

  • Jusqu’à présent, Europeana n’était pas réellement une bibliothèque numérique, mais seulement un portail d’accès, qui moissonnait les métadonnées des institutions contributrices de contenus et renvoyait par un lien vers leur site pour la consultation effective des fichiers (par le biais du protocole OAI-PMH). Ici, il semble bien qu’il soit question qu’Europeana héberge directement les fichiers, ce qui change sensiblement  la donne.
  •  Les collections numérisées par Google figurent bien parmi  les sources de documents qui viendraient alimenter ce projet (extensive collections from Google Books).

En quoi est-ce que cette évolution est importante ?

On le sait (et j’en ai souvent parlé sur S.I.Lex), les bibliothèques partenaires de Google pour la numérisation de leurs collections sont liées au moteur de recherche par un contrat, généralement gardé secret, qui leur impose certaines restrictions d’usage des fichiers leur étant remis à l’issue de l’opération.

Parmi ces restrictions d’usage, on trouve une exclusivité commerciale, mais aussi l’interdiction d’entrer en partenariat avec des tiers pour leur remettre les fichiers afin qu’ils les rediffusent. C’est une chose que l’on constatait par exemple en lisant le CCTP du marché liant la Ville de Lyon à Google (heureusement rendu public suite à une décision de la CADA). Il était notamment indiqué que les partenariats devaient se limiter à « la consultation des fichiers numérisés [par Google] dans le cadre de la bibliothèque numérique propre à la BML et sans transmission des fichiers aux partenaires« . Difficile du coup pour la Bibliothèque de Lyon de remettre ses fichiers à Europeana ou à quiconque…

Pourtant, Google s’est toujours voulu rassurant sur ce point, en garantissant qu’il permettrait les collaborations avec Europeana. Et à chaque fois que Google a signé avec une bibliothèque en Europe, la communication associée à l’évènement précisait que les documents pourraient être « rendus disponibles par le biais d’Europeana« .

Si l’on prend par exemple le dernier gros contrat signé le mois dernier avec la British Library, celle-ci indique sur son site :

The British Library and Google today announced a partnership to digitise 250,000 out-of-copyright books from the Library’s collections […] Selected by the British Library and digitised by Google, both organisations will work in partnership over the coming years to deliver this content free through Google Books (http://books.google.co.uk) and the British Library’s website (www.bl.uk). Google will cover all digitisation costs […] It is also planned to make the works available via Europeana (http://www.europeana.eu/), the European Digital Library.

A mes yeux, cette dernière phrase (make the works available via Europeana / Rendre les oeuvres accessibles sur Europeana) relevait surtout de  la communication et n’apportait  que très peu de garanties, étant donné la manière dont fonctionnait Europeana jusqu’à présent. Je l’avais expliqué lorsque Google avait signé avec la Bibliothèque nationale d’Autriche :

Pour prouver l’absence exclusivité, on nous dit également que les ouvrages seront accessibles dans Europeana. Ce sera certainement vrai, mais ce type d’accès ne prouve absolument rien ! Le fait que les ouvrages soient accessibles par le biais d’Europeana ne veut pas dire que Google va remettre une copie des ouvrages à la Bibliothèque et une autre à Europeana. C’est méconnaître la manière décentralisée dont fonctionne Europeana.

En effet, Europeana n’est pas une bibliothèque numérique au sens propre dans la mesure où elle ne stocke pas les fichiers des oeuvres auxquelles elle donne accès. Il s’agit d’un simple portail permettant la recherche fédérée à partir d’un ensemble de ressources qui sont stockées sur les serveurs des établissements culturels partenaires au niveau national. On ne consulte que des notices sur Europeana qui sont collectées par le biais du protocole OAI-PMH. Pour la consultation des oeuvres, il faut suivre un lien hypertexte qui renvoie vers le site des établissements partenaires.

Dès lors, le fait que les livres de la BN d’Autriche soient accessibles par le biais d’Europeana ne nous dit absolument rien sur sa capacité à donner les fichiers eux-mêmes à des tiers et Google n’a quand même pas encore le pouvoir d’interdire les liens hypertexte !

Mais si le nouveau programme Europeana Libraries aboutit à ce qu’Europeana évolue pour héberger et diffuser par elle-même des fichiers, alors les réserves que j’émettais ci-dessus tombent et cela signifiera que Google aura accepté de mettre à disposition ses fichiers.

Or dans la liste des établissements partenaires du programme Europeana Libraries, on trouve effectivement plusieurs bibliothèques qui ont un accord de numérisation avec Google et qui pourraient donc verser des fichiers produits par la firme dans Europeana :

  • Université d’Etat de Bavière
  • Université Complutense de Madrid
  • Université de Gand
  • Université d’Oxford

Bien sûr, cela ne nous dit pas encore complètement si ces fichiers seront couverts ou non par les exclusivités figurant dans les contrats Google, mais cette nouvelle est tout de même encourageante et Google semble de toutes façons revenir peu à peu sur les restrictions qu’il exigeait auparavant (voir ici pour les Etats-Unis et là pour l’Europe).

Si Europeana « ingère » effectivement des fichiers en provenance de Google Book, alors elle pourrait connaître une évolution semblable à celle de Hathi Trust, l’entrepôt numérique partagé par les grandes bibliothèques américaines, Google ayant explicitement accepté que ses partenaires y versent leurs fichiers en masse.

Une différence notable serait toutefois qu’Europeana ne contiendrait que des ouvrages du domaine public (les bibliothèques européennes ayant refusé de confier à la firme la numérisation d’oeuvres protégées), alors qu’Hathi Trust contient une grande proportion d’ouvrages sous copyright (73% selon  cette excellente présentation).

Cette évolution est sans doute bénéfique, pour garantir la préservation de ces fichiers à long terme, ainsi que renforcer la maîtrise sur ce patrimoine numérisé. Mais on se demande comment sera financée la mise en place des coûteuses infrastructures nécessaires pour qu’Europeana ne soit plus un simple portail, mais devienne une véritable bibliothèque numérique…


8 réflexions sur “Tout est dans tout (y compris Google Books dans Europeana…)

  1. Personnellement, en tout cas, je m’oppose formellement à ce que la BNF agisse comme si elle était propriétaire des ouvrages issus du dépôt légal. Il y a dans tout cela un glissement vers une privatisation du fonds de la BNF qui est très choquant. La BNF n’est que dépositaire du fonds. Si elle en devient propriétaire, alors personnellement, je me prononcerai pour une grève du dépôt légal.

  2. Il me semble qu’il y a dans ce billet largement de quoi tempérer l’anti-googlisme primaire qu’on entend souvent du côté des élites françaises. Si on a une alternative mondiale (Hathi Trust et/ou Europeana), d’ampleur, librement accessible publique et très alimentée du patrimoine mondial numérisé alors on ne peut plus critiquer google sur une appropriation indue de ce même patrimoine non ? ça montre que l’objectif de Google, contrairement à ce qu’on a beaucoup lu n’est pas de capter des données mais de l’attention, or il me semble que l’enjeu patrimonial n’est pas dans l’attention mais dans les données…

    1. Je suis d’accord avec toi pour dire qu’il faut certainement relativiser les critiques à l’encontre de Google Books, pour ce qui est de la numérisation du domaine public, car il y a eu des avancées ces derniers temps.

      Néanmoins, je nuancerai sur plusieurs points :

      – Les accords conclus entre Google et les bibliothèques partenaires continuent à rester secrets (British LIbrary, KB, Bibliothèque nationale d’Autriche, Bibliothèques italiennes…). Rien que pour cette atteinte fondamentale au principe de transparence, cela condamne à mes yeux l’entreprise de Google ;

      – Il faut vraiment lire entre les lignes pour arrive rà comprendre que Google a certainement accepté une diffusion de ses fichiers par Europeana. Là encore, pas d’annonce officielle claire et pas de publication surtout de ce nouvel accord (si il y en a un).

      – Enfin et c’est le plus important, les fichiers peuvent très bien aller dans Europeana sans que toutes les formes d’exclusivité ne soient levées. Il peut rester une exclusivité commerciale, l’exclusivité d’indexation et des restrictions d’usages.

      Voilà pour quoi ce sera bien sûr un progrès si ces fichiers vont dans Europeana, mais ce n’est pas la fin du débat.

      Pour moi, le domaine public est le domaine public. Point barre. Avec liberté de reproduire et de représenter, y compris à des fins commerciales. Toute restriction est illégitime, sinon il y a destruction de la notion de domaine public.

      Tant qu’on ne sera pas à ce résultat, rien n’aura été fait.

      1. « Pour moi, le domaine public est le domaine public. Point barre. Avec liberté de reproduire et de représenter, y compris à des fins commerciales. Toute restriction est illégitime, sinon il y a destruction de la notion de domaine public. » C’est absolument vrai!

      2. Oui, mais … le domaine public, aujourd’hui, ne s’applique pas à bon nombre de documents, puisque pour reproduire une page, une illustration, etc, il faut payer un droit. ce droit à régler est parfaitement discutable, mais on voit bien qu’avec le projet Google, on n’est plus dans le même cadre. On ne sait d’ailleurs qui paie quoi ni en fonction de quel critère. Tout cela est fait dans la plus parfaite opcité.
        D’ailleurs, il est certain qu’un accord cadre dont on ne connaît pas le contenu doit être rejeté par principe.
        Enfin, si l’accord Google inclut l’exploitation des œuvres orphelines ou abandonnées qui ne sont pas dans le domaine public, c’est un scandale.
        Si l’on réduit la quantité d’œuvres à numériser, le chiffre est bien moins élevé que les millions évoqués. Cela non plus n’est pas pris en en compte dans la présentation faite par la BNF. Donc il y a volonté de dramatiser, et cela aussi rend l’affaire suspecte.
        En somme, quel que soit le bout par lequel on prend ce dossier, il est inacceptable.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.