Corpus: BFM2019

Corpus: BFM2019

Chère collègue, cher collègue,
Nous avons le plaisir d’annoncer la publication du corpus BFM2019 de la Base de français médiéval :http://txm.bfm-corpus.org/?command=documentation&path=/BFM2019 .
Le graphisme du portail BFM-TXM a été entièrement repensé et embelli à cette occasion.
Les conditions d’utilisation ont été simplifiées et tous les textes sont diffusés sous licence ouverte Etalab (https://www.etalab.gouv.fr/licence-ouverte-open-licence).
Le corpus BFM2019 comprend une quinzaine de nouveaux textes et atteint environ 4 700 000 mots. Tous les textes sont encodés selon les recommandations du consortium TEI, balisés pour le discours direct, automatiquement annotés en morphosyntaxe et lemmatisés. L’étiquetage morphosyntaxique a été vérifié pour 4 nouveaux textes (38 textes vérifiés, soit près de 1 000 000 mots) et la lemmatisation pour 18 textes (environ 400 000 mots).
Le corpus s’enrichit aussi de trois nouvelles éditions originales :
– La Vie de saint Alexis par T. Rainsford et C. Marchello-Nizia
– L’image du monde de Gossouin, version en prose, par N. Kanaoka
– Les quinze joies de mariage, par N. Kanaoka sur la base de l’édition imprimée établie par M. Guéret-Laferté, S. Louis et C. Mira, Rouen, Presses universitaires de Rouen et du Havre, 2009.
N’hésitez pas à nous signaler tout problème technique ou erreur dans un texte du corpus.
Bien cordialement,
Équipe BFM
bfm [at] ens-lyon [point] fr