https://www.ortolang.fr/market/corpora/democrat
Le corpus Democrat est un corpus textuel annoté en références. Les expressions référentielles sont repérées et annotées avec l’identifiant du référent, ce qui permet de construire les chaînes de référence.
La composition du corpus est établie dans l’objectif d’étudier la variation des chaînes de référence en fonction des genres discursifs et des époques. La composition est établie selon trois critères : époque, type de texte (narratif ou non-narratif), genre textuel. La taille du corpus a été envisagée pour permettre des applications de traitement automatique des langues.
Ce corpus est l’un des livrables du projet ANR Democrat (ANR-15-CE38-0008).
Frédéric Landragin. Description, modélisation et détection automatique des chaînes de référence (DEMOCRAT). Bulletin de l’Association Française pour l’Intelligence Artificielle, AFIA, 2016, pp.11-15. ⟨afia.asso.fr⟩. ⟨hal-01347949⟩
Langues, textes, traitements informatiques, cognition – UMR 8094 (Lattice), Linguistique, Langues, Parole – EA 1339 (LiLPa), Interactions, corpus, apprentissages et représentations – UMR 5191 (ICAR), Institut d’histoire des représentations et des idées dans les modernités – UMR 5317 (IHRIM) (2019). Democrat [Corpus]. ORTOLANG (Open Resources and TOols for LANGuage) – www.ortolang.fr, https://hdl.handle.net/11403/democrat/v1.1.