Favoriser la réutilisation des archives : règles et bonnes pratiques de l’open data
Expertise et analyse
Les services d’archives sont de plus en plus nombreux à se lancer dans l’ouverture de leurs données et contenus, afin d’en permettre la réutilisation libre et gratuite par tout un chacun. Les bénéfices d’une telle démarche sont nombreux, sur le plan culturel, économique et sociétal. Mais la complexité du cadre juridique et technique de l’open data peut dérouter. On fait le point sur les bonnes pratiques à suivre pour favoriser la réutilisation des archives numériques.
Le régime juridique de la réutilisation des archives
Communicabilité vs Réutilisation : deux logiques différentes et complémentaires
La communicabilité et la réutilisation des archives publiques résultent de deux régimes juridiques distincts et complémentaires :
Le régime de communication, défini dans le code du patrimoine (articles L213-1 à L213-8) : il s’agit des règles connues de tous les archivistes, selon lesquelles les archives publiques sont communicables de plein droit à l’expiration de certains délais. L’accès aux archives s’exerce dans les conditions définies pour l’accès aux documents administratifs, défini aux articles L300-1 et suivants du code des relations entre le public et l’administration (CRPA).
Le régime de la réutilisation des informations publiques, qui s’articule avec celui de l’accès aux documents administratifs et prévoit les conditions dans lesquelles les informations contenues dans les documents administratifs peuvent être utilisées “par toute personne qui le souhaite à d’autres fins que celles de la mission de service public pour les besoins de laquelle les documents ont été produits ou reçus” (article L321-1 du CRPA).
Les archives publiques sont soumises au régime de la réutilisation des informations publiques, sous réserve de certaines dispositions spécifiques, notamment une exception au principe de gratuité (article L324-2 du CRPA). En effet, les institutions culturelles (archives, bibliothèques, musées) ont la possibilité d’établir une redevance de réutilisation pour amortir les coûts liés aux opérations de numérisation. Il est toutefois préférable d’opter pour la réutilisation libre et gratuite afin de profiter de tous les bénéfices de l’open data.
Les bénéfices de l’open data dans le champ archivistique
Le cadre juridique de la réutilisation des archives couvre l’ensemble des données du secteur public et répond à une volonté du législateur européen de renforcer le marché intérieur et de favoriser les innovations numériques. Dans la sphère culturelle, l’open data porte aussi la promesse d’un meilleur accès au patrimoine culturel et représente un atout pour la recherche et l’innovation. Sur le plan économique, l’enjeu est de concilier la gratuité avec les contraintes budgétaires des services d’archives.
Démocratiser l’accès au patrimoine culturel et valoriser les fonds d’archives
S’engager dans une démarche d’ouverture des archives (données et contenus) est un moyen efficace de favoriser l’accès au patrimoine culturel et d’associer les publics à la valorisation des fonds. En effet, la réutilisation des archives offre de nouvelles possibilités en termes d’usages pour les publics : on pense par exemple aux projets d’indexation collaborative, à travers lesquels les services d’archives créent du lien avec leurs publics et encouragent la préservation de la mémoire collective et l’enrichissement des fonds.
Par ailleurs, les archives ouvertes constituent une ressource précieuse pour développer des supports pédagogiques dans le secteur éducatif, contribuant ainsi à sensibiliser les jeunes générations à la mémoire collective.
Favoriser la recherche et l’innovation
L’ouverture des données et contenus archivistiques s’inscrit également dans une logique de stimulation de la recherche et de l’innovation. On citera notamment les avancées récentes en matière d’intelligence artificielle, qui ouvrent la voie à des projets enthousiasmants en matière de reconnaissance d’écriture, d’indexation automatique et d’analyse de données.
Stimuler l’économie de la création
Si le cadre juridique de l’open data encourage la réutilisation libre et gratuite des données publiques, il permet aussi aux institutions culturelles de soumettre la réutilisation à une redevance pour amortir les opérations de numérisation. Mais faire un tel choix reviendrait à passer à côté de la philosophie open data. L’absence de barrière tarifaire est en effet un élément important et un atout pour de nombreux acteurs économiques complémentaires des services d’archives : on pense notamment aux entreprises de généalogie successorale et d’histoire familiale, mais aussi aux éditeurs, sociétés de production et créateurs de tous horizons.
Pour faire face aux contraintes financières liées à la numérisation, les services d’archives ont la possibilité d’accorder un droit d’exclusivité à un partenaire privé. Bien que temporaire (15 ans maximum), un tel droit d’exclusivité limite aussi les possibilités de réutilisation. Un compromis peut consister à limiter contractuellement la portée de cette exclusivité à l’exploitation d’une partie substantielle du fonds numérisé, tout en permettant la réutilisation libre et gratuite à petite échelle.
Comment traiter les données archivistiques en vue de leur réutilisation ?
S’engager dans une démarche d’ouverture des données implique une réflexion sur toute la chaîne archivistique : de la numérisation des archives à leur diffusion, en passant par la standardisation des métadonnées et le recours à des formats de fichiers ouverts.
Opter pour des outils et pratiques favorisant l’interopérabilité
L’adoption de normes et protocoles favorisant l’interopérabilité font partie intégrante d’une démarche d’ouverture et jouent un rôle clé dans les possibilités offertes en matière de réutilisation. Faisons le point sur deux initiatives majeures pour la réutilisation des archives : le protocole OAI-PMH et le cadre normatif IIIF (à prononcer “trois-I-F”).
OAI-PMH : un protocole pour la collecte et l’échange de métadonnées
OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) est un protocole développé par l’Open Archives Initiative pour standardiser la collecte de métadonnées entre différents systèmes de gestion de données. Il facilite l’interopérabilité afin que les métadonnées soient accessibles à d’autres services, tels que des moteurs de recherche spécialisés, des portails thématiques, ou des réseaux de recherche académique.
Les serveurs configurés pour le protocole OAI-PMH rendent les métadonnées accessibles selon des formats standardisés afin de faciliter leur moissonnage (harvesting). OAI-PMH supporte plusieurs formats de métadonnées, tels que le Dublin Core et l’XML-EAD, ce dernier étant privilégié pour présenter les documents d’archives. C’est le cas du logiciel Mnesys Expo de Naoned qui utilise l’EAD pour son entrepôt OAI-PMH.
IIIF : un cadre normatif pour visualiser les archives numérisées
IIIF (International Image Interoperability Framework) est un ensemble de normes techniques conçues pour faciliter la diffusion, la visualisation et la manipulation d’images numériques à grande échelle. L’objectif du IIIF est de permettre aux institutions culturelles de présenter leurs collections d’images de manière interopérable, permettant ainsi à d’autres sites ou applications d’intégrer vos médias sans avoir à les copier ou les héberger.
Plus précisément, IIIF définit 6 spécifications d’API (interface programmatiques), dont 2 seulement sont obligatoires :
API image : offre des fonctionnalités d’accès au média et de manipulation de l’image (rotation, colorimétrie, rognage, zoom, etc.).
API présentation : standardise la structuration des métadonnées de documents divers et facilite l’affichage des images.
L’API image propose 3 niveaux de conformité, le niveau 0 étant défini comme un ensemble minimum de paramètres et de fonctionnalités à implémenter pour que le service soit conforme à la norme IIIF. À ce niveau, l’API image offre un véritable atout en termes d’interopérabilité. Toutefois, sur les fonctionnalités avancées, IIIF conduit à une hétérogénéité dans l’implémentation (API optionnelles, paramètres spécifiques…), ce qui nuit mécaniquement à l’interopérabilité.
Enfin, force est de constater que l’architecture technique IIIF n’est pas satisfaisante sur plusieurs points. Par exemple, les opérations de manipulation d’images sont centralisées côté serveur, et non sur l’ordinateur des internautes. Cette architecture conduit à surdimensionner l’infrastructure pour absorber les périodes de fort trafic, ce qui peut générer une surconsommation de ressources dans les périodes creuses. Il est donc nécessaire de faire preuve de discernement dans l’utilisation de IIIF.
En conclusion, OAI-PMH et IIIF sont des outils bien utiles pour les services d’archives engagés dans une démarche d’ouverture, même si les normes ne sont pas suffisamment contraignantes pour permettre d’atteindre pleinement la promesse d’interopérabilité.
Toutefois, ces normes et protocoles favorisant l’interopérabilité sont orientés vers la réutilisation à petite échelle d’images ou de sets d’images. Pour les partenariats impliquant une réutilisation massive des archives, la mise à disposition des données se fait via des moyens conventionnels, tels que des transferts FTP ou la fourniture de supports de stockage. C’est le cas de Naoned, qui propose par exemple des prestations de dépôt et traitement de médias par disque dur ou FTP dans leur accompagnement.
Comment valoriser les archives ouvertes ?
S’engager dans une démarche d’ouverture des archives suppose de faire évoluer les opérations de collecte et de traitement, ainsi que les actions mises en place pour la diffusion et la communication.
Diffuser les archives ouvertes sur un portail web attrayant
Un portail web esthétique et intuitif est indispensable pour capter l’attention et faciliter l’accès aux archives numériques. Ces plateformes doivent offrir une expérience utilisateur optimale, avec une interface claire et une navigation fluide. La difficulté est de s’adapter aux besoins des différents publics :
Pour les professionnels (historiens, généalogistes, etc.), le portail doit intégrer des fonctionnalités de recherche avancées (filtres, options de tri, outils de recherche textuelle, etc.).
Pour le grand public, une interface claire met en valeur les archives et facilite la consultation et la réutilisation. Bien plus qu’un moyen d’accéder aux archives, le portail web comprend une dimension éditoriale et offre des perspectives historiques et culturelles enrichissantes aux utilisateurs.
Par ailleurs, les services d’archives doivent penser à communiquer sur leur politique d’open data et sur les modalités concrètes de réutilisation des données. Pour ce faire, les réseaux sociaux constituent un canal de communication efficace : les archivistes peuvent y promouvoir les projets présentés sur le portail et encourager la réutilisation des archives ouvertes, tout en créant un lien direct avec les publics.
Développer les usages avec les publics
Favoriser la réutilisation des archives numériques est un projet humain avant d’être un projet technique. La réutilisation est un moyen de créer du lien autour des archives qui forment notre mémoire collective. Cette démarche prend tout son sens lorsqu’elle s’inscrit dans un développement des collaborations avec les établissements scolaires, les chercheurs et, plus généralement, l’ensemble des publics afin de valoriser le patrimoine archivistique.
« Chez Naoned, nous impliquons l’utilisateur dès les premières phases de conception. Nous observons son environnement de travail, recueillons ses besoins, et construisons ensemble des parcours fonctionnels que nous testons avec les utilisateurs »
Audrey, consultante fonctionnelle
Le numérique bouleverse le métier d’archiviste. Désormais, les compétences techniques sont indispensables pour maîtriser les logiciels de gestion et valoriser les archives. À travers cet article, nous explorons les enjeux de cette transformation numérique…et de la formation au numérique pour les archivistes.