Archives en ligne : une étude des conditions de réutilisation

Au mois de juin dernier, j’avais produit une étude des conditions de réutilisation de 122 bibliothèques numériques françaises à partir de l’analyse de leurs mentions légales, à l’occasion de la journée d’étude organisée par l’IABD (Interassociation Archives Bibliothèques Documentation) « Numériser les œuvres du domaine public, et après ? Diffusion, réutilisation, exploitation : des objectifs contradictoires ? » (actes en ligne et compte rendu).

A titre de comparaison, il m’avait paru intéressant de prolonger cette première étude en direction d’autres institutions culturelles, à commencer par les services d’archives, qui produisent une grande partie de l’effort de numérisation au niveau national (et on a un peu trop tendance à l’oublier en ce moment…).

Étudier la question de la réutilisation des contenus numérisés est particulièrement fécond à propos des archives, en raison du nombre et de la variété des sites, ainsi que des types de documents concernés. Par ailleurs, les communautés d’utilisateurs comme les généalogistes ou les historiens locaux expriment des besoins très nets en matière de réutilisation (voir ici ou ici).

Je vous propose donc une étude établie à partir de l’analyse des mentions légales de 85 sites d’archives en ligne, aussi bien municipales que départementales et nationales (j’ai laissé de côté en revanche la question des services d’archives privés). Vous pourrez retrouver les données « brutes » de cette enquête qui ont été compilées et traitées grâce à une base de favoris Delicious (outil très utile pour réaliser ce type d’étude statistique en taguant chaque élément à l’aide d’une série d’étiquettes). La liste des établissements répertoriés figure sur Bibliopedia (page Archives en ligne) et elle a également été transposée sur une carte Google (toutes les deux ouvertes et modifiables librement). Pour avoir un aperçu de la richesse des fonds mis en ligne par les services d’archives, je vous renvoie à mon billet précédent dans S.I.Lex.

La synthèse réalisée à partir de ces données figure dans la présentation ci-dessous, qui a été versée sur Slideshare.

Je préfère vous renvoyer à l’étude plutôt que de produire un long commentaire ici, mais globalement les résultats sont assez proches de ce que j’avais pu constater à propos des bibliothèques numériques françaises. Une certaine tendance à la fermeture apparaît qui résulte autant de la technique juridique employée pour formuler les mentions légales que de la politique suivie en matière de réutilisation.

Dans la majorité des cas, le fondement juridique retenu pour imposer des restrictions à la réutilisation est celui de la propriété intellectuelle (les images ou les sites sont « copyrightés » ; on invoque la contrefaçon en cas de violation des conditions ; on vise le CPI…). Ce choix conduit généralement à mettre en œuvre une approche « Tous droits réservés » qui bloque a priori toute forme de réutilisation. Quand des usages sont autorisés, c’est souvent uniquement à des fins personnelles ou privées, ce qui empêche la réutilisation en ligne, y compris à des fins non commerciales (un usage sur Internet sera public dans la plupart des cas). Même pour des réutilisations légitimes, à des fins pédagogiques ou de recherche, l’autorisation reste souvent la règle, car il s’agit là encore d’usages collectifs qui n’entrent pas dans le champ étroit de l’usage privé.

Ce recours à la propriété intellectuelle pour conditionner ou interdire la réutilisation est contestable et certainement fragile, car il est douteux que le processus de numérisation fasse renaître des droits sur les documents numérisés, faute de présenter une originalité suffisante. C’est vrai pour les œuvres du domaine public que les archives numérisent (photos, ouvrages, presse, iconographie, etc.), mais plus encore pour les documents administratifs (état civil, recensement, cadastre, etc.) qui n’ont jamais été des œuvres et qui ne devraient pas passer à l’issue du processus de la numérisation sous l’emprise de la propriété intellectuelle.

Je peux réutiliser cette carte sur ce blog, car elle a été placée sous licence Creative Commons CC-BY-NC sur le site Bourg-en-Doc. Bien qu'appréciable, ce procédé conduit néanmoins à placer un document du domaine public sous un régime de propriété intellectuelle, ce qui n'est pas tout à fait "juridiquement correct". (Carte du gouvernement de Bourg-en-Bresse en 1634-1636. Archives municipales de Bourg-en-Bresse)

Si les pratiques en matière de mentions légales des sites sont plus homogènes pour les archives que les bibliothèques, elles restent encore assez dispersées et l’information juridique présente souvent des problèmes de visibilité et de lisibilité, surtout pour des non juristes. Comme pour les bibliothèques, l’harmonisation des pratiques en la matière apporterait un vrai plus aux utilisateurs, ainsi que la normalisation de la manière dont les mentions sont exprimées.

Au final, on retire l’impression que si les archives remplissent à présent un incomparable service en ligne de diffusion du patrimoine, le tournant de la réutilisation n’est pas encore anticipé juridiquement. Pourtant, au regard des pratiques du web, c’est certainement le grand enjeu de la numérisation qui attend les institutions culturelles dans les prochaines années, et il ne sera bientôt plus possible de concevoir la numérisation uniquement en termes de mise en ligne des documents sur un site.

Certains établissements d’archives étrangers conduisent déjà des expérimentations dans ce domaine, comme les Archives fédérales allemandes (Bundesarchiv) qui ont versé 100 000 images dans Wikimedia Commons ou les Nationaal Archiev des Pays-Bas qui participent au programme Flickr The Commons. Dans les deux cas, ces stratégies de dissémination sur ces plateformes nécessitent de modifier l’approche vis-à-vis des droits pour passer à une logique d’Open Access. Des moyens juridiques existent pour ce faire, comme la nouvelle licence Creative Commons Zéro (CC0) qui permet de « marquer » le domaine public en ligne.

La question de la réutilisation se pose certainement de manière plus complexe pour les archives que pour les bibliothèques. Les documents qu’elles diffusent présentent des natures juridiques disparates (oeuvres du domaine public, archives publiques, archives privées, etc) et peuvent s’avérer sensibles (notamment lorsqu’ils comportent des données personnelles). Les enjeux sont aussi certainement plus complexes à appréhender, car il existe des besoins de récupération des documents de la part d’opérateurs souhaitant proposer des offres commerciales.

Pour autant, les archives en ligne ont aussi l’avantage de s’adresser à de véritables communautés d’utilisateurs, avec lesquelles les services peuvent développer de nouveaux types de relations en phase avec les usages numériques émergents. Les expérimentations d’annotation collaborative de documents (voir par exemple les archives de l’Ain, des Yvelines ou de la ville de Rennes) sont particulièrement intéressantes de ce point de vue. D’autres exemples à l’étranger montrent que les services d’archives ont tout le potentiel nécessaire pour s’aventurer avec succès sur le Web 2.0 (voyez cette excellente présentation québécoise).

A condition peut-être de modifier l’approche concernant les droits pour mettre en place des modèles plus équilibrés qui ménagent une place à la réutilisation des contenus…

J’espère que cette étude pourra être utile et apporter des éléments concrets au débat sur les pratiques des services d’archives.

Resterait à reproduire un tel travail pour les musées afin d’avoir une vue complète du statut du domaine public numérisé en France.

Peut-être un jour…

Mise à jour du 27/11/10 : Pour prolonger la réflexion, je vous invite à aller lire une série de billets sur le blog ThinkingTwice, consacrés à la réutilisation des données publiques : ici, ici, , et .

Mise à jour du 28/11/10 : A lire aussi, ce billet qui soulève cette fois des questions quant à l’accès même aux archives en ligne Les archives départementales du Calvados sont en ligne et… payantes


7 réflexions sur “Archives en ligne : une étude des conditions de réutilisation

  1. L’étude et surtout ses résultats sont passionnants. Le plus surprenant est cette « appropriation » d’éléments du domaine public (cadastre…) par des institutions… publiques, qui en empêchent ensuite la réutilisation à moins de payer un droit…

  2. Si je conçois le renvoi à la propriété intellectuelle pour les oeuvres qui sont effectivement protégées, je me demande si une référence au droit de la concurrence (par rapport à l’investissement entrepris pour numériser les oeuvres/archives) ne serait pas plus appropriée?

  3. Bonjour !
    Qu’elle différence entre personnel et privé ?
    La notion de personnel désignant une famille ou un groupe (de descendants par exemple) est elle correcte ?
    La publication sur Internet n’autorisant l’accès qu’à des utilisateurs munis d’un mot de passe tient-elle du domaine privé ou personnel ?
    Exemple : le logiciel Gramps (libre en licence GNU GPL) permet de synthétiser ses recherches généalogiques sous forme de site Internet. Le simple fait d’autoriser l’accès par un mot de passe suffirait-il a intégrer le domaine privé ? Personnel ?
    Grand merci ;-)

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.