L’intelligence artificielle au service des archives : le projet SOCFACE
Expertise et analyse
Le projet Socface c’est quoi ?
Le projet Socface développe des technologies de reconnaissance automatique d’écriture manuscrite pour analyser l’ensemble des listes nominatives du recensement de 1836 à 1936 (soit 20 recensements) et produire une base de données des individus ayant vécu en France durant cette période.
Après avoir été sélectionné par l’ANR (Agence Nationale pour la Recherche) en septembre 2021, le projet a pu démarrer officiellement et durera un peu plus de 3 ans.
La phase de collecte des données auprès des services d’archives pilotes a débuté en 2022 et devrait se terminer en 2023.
L’objectif est de collecter le plus grand nombre de données possibles afin de construire et d’entrainer les algorithmes de reconnaissance d’écriture.
Naoned intervient activement pendant cette phase puisque nos ingénieurs fournissent à Teklia les données des 18 services d’archives (utilisateurs des logiciels Mnesys) qui ont accepté de participer au projet pilote.
Un grand merci aux Archives départementales d’Alsace, de Corrèze, Calvados, Doubs, Drôme, Eure, Essonne, Hérault, Indre et Loire, Jura, Marne, Meuse, Nièvre, Nord, Rhône, Seine Saint Denis, Somme et le Territoire de Belfort qui se sont portés volontaires.
Phases suivantes
Après cette première phase de collecte, viendront ensuite les phases :
de « linking » ou appariement (identification des personnes et lien entre les recensements) par les historiens et les économistes
d’études historiques et économiques
de valorisation (France Archives, portails d’archives…), dans laquelle Naoned interviendra également avec son logiciel Mnesys Expo.
Afin de mieux comprendre le projet et d’en savoir plus sur les différents cas d’usage de reconnaissance automatique de documents d’archives, nous mettons à votre disposition deux conférences réalisées pour Naoned par Christopher Kermorvant, directeur scientifique et président de la société Teklia, chercheur associé à l’Université de Rouen.
Conférences autour du projet Socface
Que peut l’intelligence artificielle pour les archives ?
Retrouvez la conférence de Christopher Kemorvant, directeur scientifique et président de la société Teklia, aux Journées Mnesys 2021 (les rencontres annuelles des utilisateurs de logiciels Mnesys).
Dans cette conférence, Christopher fait le point avec nous sur l’état de l’art des techniques d’IA pour le traitement de documents et sur les cas d’usages de reconnaissance automatique des documents d’archives.
Comme de nombreux secteurs d’activité, le traitement automatique des documents d’archives a été fortement impacté par les récents développements de l’Intelligence Artificielle et du Deep Learning.
Que peuvent faire les machines aujourd’hui qu’elles ne pouvaient pas faire avant ?
Quelles sont les performances ?
Comment mettre en place un projet de traitement automatique de documents ?
Point d’étape du projet Socface – Juin 2022
Cette conférence de Christopher Kemorvant, directeur scientifique et président de la société Teklia, a été enregistrée pendant les Journées Mnesys 2022 (les rencontres annuelles des utilisateurs de logiciels Mnesys).
Christopher vous propose dans cette conférence de faire un point d’étape de l’avancée du projet SOCFACE.
« Chez Naoned, nous impliquons l’utilisateur dès les premières phases de conception. Nous observons son environnement de travail, recueillons ses besoins, et construisons ensemble des parcours fonctionnels que nous testons avec les utilisateurs »
Audrey, consultante fonctionnelle
Le numérique bouleverse le métier d’archiviste. Désormais, les compétences techniques sont indispensables pour maîtriser les logiciels de gestion et valoriser les archives. À travers cet article, nous explorons les enjeux de cette transformation numérique…et de la formation au numérique pour les archivistes.