22 juin 2022

L’intelligence artificielle au service des archives : le projet SOCFACE

  • Expertise et analyse

Le projet Socface c’est quoi ?

Le projet Socface développe des technologies de reconnaissance automatique d’écriture manuscrite pour analyser l’ensemble des listes nominatives du recensement de 1836 à 1936 (soit 20 recensements) et produire une base de données des individus ayant vécu en France durant cette période.

La société Teklia pilote le projet, en collaboration avec l’INED (Institut National d’études Démographiques) et la Paris School of Economics. Le SIAF, France Archives sont partenaires du projet, Naoned y participe également.

Après avoir été sélectionné par l’ANR (Agence Nationale pour la Recherche) en septembre 2021, le projet a pu démarrer officiellement et durera un peu plus de 3 ans.

Vous pouvez retrouvez toutes les informations sur le site officiel :  https://socface.site.ined.fr/ 

Phase de collecte

La phase de collecte des données auprès des services d’archives pilotes a débuté en 2022 et devrait se terminer en 2023.

L’objectif est de collecter le plus grand nombre de données possibles afin de construire et d’entrainer les algorithmes de reconnaissance d’écriture.

Naoned intervient activement pendant cette phase puisque nos ingénieurs fournissent à Teklia les données des 18 services d’archives (utilisateurs des logiciels Mnesys) qui ont accepté de participer au projet pilote.

Un grand merci aux Archives départementales d’Alsace, de Corrèze, Calvados, Doubs, Drôme, Eure, Essonne, Hérault, Indre et Loire, Jura, Marne, Meuse, Nièvre, Nord, Rhône, Seine Saint Denis, Somme et le Territoire de Belfort qui se sont portés volontaires.

Phases suivantes

Après cette première phase de collecte, viendront ensuite les phases :

Afin de mieux comprendre le projet et d’en savoir plus sur les différents cas d’usage de reconnaissance automatique de documents d’archives, nous mettons à votre disposition deux conférences réalisées pour Naoned par Christopher Kermorvant, directeur scientifique et président de la société Teklia, chercheur associé à l’Université de Rouen.

Conférences autour du projet Socface

Que peut l’intelligence artificielle pour les archives ?

Retrouvez la conférence de Christopher Kemorvant, directeur scientifique et président de la société Teklia, aux Journées Mnesys 2021 (les rencontres annuelles des utilisateurs de logiciels Mnesys).

Dans cette conférence, Christopher fait le point avec nous sur l’état de l’art des techniques d’IA pour le traitement de documents et sur les cas d’usages de reconnaissance automatique des documents d’archives.

Comme de nombreux secteurs d’activité, le traitement automatique des documents d’archives a été fortement impacté par les récents développements de l’Intelligence Artificielle et du Deep Learning.

Point d’étape du projet Socface – Juin 2022

Cette conférence de Christopher Kemorvant, directeur scientifique et président de la société Teklia, a été enregistrée pendant les Journées Mnesys 2022 (les rencontres annuelles des utilisateurs de logiciels Mnesys).

Christopher vous propose dans cette conférence de faire un point d’étape de l’avancée du projet SOCFACE.

Articles similaires

Photo des archivistes de Namur en formation sur le logiciel Mnesys Archives

Les archivistes à l’ère du numérique : le défi de la formation

Le numérique bouleverse le métier d’archiviste. Désormais, les compétences techniques sont indispensables pour maîtriser les logiciels de gestion et valoriser les archives. À travers cet article, nous explorons les enjeux de cette transformation numérique…et de la formation au numérique pour les archivistes.