De la source au texte intégral: atelier pratique sur l’utilisation de la reconnaissance automatique des caractères (ATR) – 7 et 8 septembre 2023
Qu’elles aient été photographiées lors d’une visite en dépôt d’archives ou trouvées sur le catalogue en ligne d’une institution patrimoniale, les images de sources textuelles constituent la base du travail scientifique pour de nombreux chercheurs et chercheuses en sciences humaines. Trouver, créer et collecter des images sur son ordinateur personnel ne reste néanmoins que la première étape du processus de recherche, et peut-être la plus simple maintenant qu’elle est facilitée par les progrès de la numérisation. L’étape suivante consiste à déchiffrer le texte figurant sur les images, à le lire ou à le transcrire, puis à l’enregistrer de manière à pouvoir travailler avec. Plus le nombre d’images est important et la transcription difficile, plus l’on souhaiterait que la technologie nous assiste dans le processus de transformation des images en textes exploitables par une machine. La bonne nouvelle, c’est que celle-ci existe et qu’elle est accessible non seulement aux grands projets, mais aussi aux chercheuses et chercheurs individuels, même pour celles et ceux qui ne sont pas familiers ou ne se sentent pas à l’aise avec les outils numériques.
L’appellation Automated Text Recognition (ATR) est utilisée de manière générique pour désigner la reconnaissance de textes imprimés par Optical Character Recognition (OCR) et la reconnaissance de textes manuscrits et tapuscrits par Handwritten Text Recognition (HTR).
À qui s’adresse l’atelier ?
Nous souhaitons, à travers cet atelier, mettre en contact des chercheuses et chercheurs issus de disciplines historiques originaires de pays francophones et germanophones. L’atelier s’adresse donc en premier lieu aux doctorantes et doctorants ainsi qu’aux post-doctorantes et post-doctorants de toutes les disciplines des sciences humaines qui travaillent sur des sources historiques allemandes et/ou françaises, quelle que soit l’époque. Les étudiantes et étudiants en master sont également les bienvenus si leur travail de master implique la conversion d’images en texte numérique, ainsi que les personnels d’appui à la recherche scientifique impliqués dans des projets mettant en œuvre ce type de corpus.
Modalités de participation
Veuillez envoyer votre candidature par e-mail à l’adresse DH@dhi-paris.fr avant le 26 juin 2023, accompagnée d’une lettre de motivation (2 pages maximum) contenant une brève esquisse de votre projet et de vos attentes concernant l’atelier, ainsi qu’un bref CV (1 page maximum), le tout dans un seul fichier PDF. Si votre candidature est sélectionnée, vous pourrez bénéficier d’une prise en charge forfaitaire de vos frais de voyage et d’hébergement dans la limite de 200 euros (pour l’Allemagne et la Suisse) et de 100 euros (pour la France) par personne.
Les langues de travail sont le français, l’allemand et l’anglais.
Organisation
- Anne Baillot (Le Mans Université),
- Floriane Chiffoleau (Inria-Paris/Le Mans Université),
- Mareike König (IHA),
- Pauline Spychala (IHA),
- Olivier Richard (Univ. Fribourg)
Avec le soutien financier de : IHA, ALMAnaCH/INRIA, Département d’histoire de l’Université de Fribourg.