Appel à contribution – Documents anciens et reconnaissance automatique des écritures manuscrites
Documents anciens et reconnaissance automatique des écritures manuscrites, colloque sur l’HTR qui se tiendra les 23 et 24 juin 2022 à l’École nationale des chartes, Paris 23-24 juin 2022 Paris (France)
Cette manifestation scientifique se tiendra les 23 et 24 juin 2022 à l’École nationale des chartes, Paris. Elle se déroulera selon des modalités mixtes avec une diffusion sur Youtube.
Nombre de projets incluent aujourd’hui une étape d’acquisition automatique du texte dans leur chaîne de production ou d’exploitation des données. Plusieurs plateformes de transcription et différents moteurs HTR sont maintenant disponibles. L’intégration de cette technologie dans des chaînes de traitement de plus en plus efficaces a entraîné une automatisation des tâches qui remet en question la place du chercheur dans le processus d’établissement du texte. Cette nouvelle pratique, gourmande en données, rend pressant le besoin de rassembler, et donc d’harmoniser les corpus nécessaires à la constitution de corpus d’entraînement, mais aussi leur mise à disposition pour améliorer la qualité des résultats de l’HTR.
Dans le cadre du projet CREMMALab soutenu par le DIM MAP, l’École nationale des chartes (centre Jean Mabillon) en partenariat avec le LAMOP et le LabEX Hastec organisera les 23 et 24 juin 2022 un colloque mêlant questions philologiques et techniques pour faire un état des lieux scientifique de l’HTR pour les documents anciens. Nous ferons le point à cette occasion sur l’HTR et ses outils, ses résultats, ses apports et les nouvelles pratiques qu’induit son utilisation dans les projets d’édition et d’exploitation des documents.
Nous espérons que cet événement permettra également de rassembler une communauté internationale de chercheurs, aujourd’hui grandissante, pour échanger autour de l’usage de l’HTR dans leurs projets scientifiques.
Ce colloque repose sur la volonté de traiter la thématique de l’HTR tout en l’articulant à des problématiques scientifiques de constitution et/ou d’exploitation des corpus. Nous souhaitons également questionner les aspects pratiques de l’utilisation de cette technologie (développement de moteur HTR, d’interface de transcription, d’interface utilisateurs pour utiliser et entrainer des modèles, etc.), tout en soulevant ses enjeux méthodologiques et son impact sur les données de la Recherche.
Pour aborder ces problématiques, nous proposons les trois axes suivants :
— Axe 1 : Constitution des données d’entraînement et de modèles d’HTR (segmentation, transcription, constitution de corpus, partage, etc.)
— Axe 2 : Apprentissage machine, technologies, plateformes de transcription (présentation d’outils HTR et de leurs performances, présentation d’outils d’aide à la transcription)
— Axe 3 : Projet ou chaînes éditoriales utilisant l’HTR ; exploitations de données issues de l’HTR.
Nous espérons que les communications et les échanges lors de ce colloque pourront aboutir à la publication des Actes de ces journées.
Les propositions de communication devront comprendre entre 750 et 1000 mots (hors bibliographie et illustrations). Elles pourront être faites en français ou en anglais jusqu’au 28 février 2022
Comité d’organisation : Ariane Pinche et Floriane Chiffoleau
Comité scientifique : Jean-Baptiste Camps, Alix Chagué, Thibault Clérice, Frédéric Duval, Vincent Jolivet, Benjamin Kiessling, Nicolas Perreaux, Ariane Pinche, Laurent Romary, Peter Stokes
Pour toute demande de renseignement, vous pouvez nous contacter à l’adresse suivante : dahtr@sciencesconf.org
Source : Sciences conf