Nous avons le plaisir de vous inviter à un workshop en ligne organisé avec nos collègues de l’Univerrsité du Pays Basque à Donostia dans le cadre du projet Linguatec auquel nous participons depuis quatre ans. C’est gratuit, il suffit de s’inscrire (voir ci-dessous).
L’équipe occitane du projet Linguatec du laboratoire CLLE – équipe Langues & langage, UMR 5263, CNRS & Université Toulouse Jean Jaurès
Myriam Bras, Aleksandra Miletic, Clamença Poujade, Louise Esher, Jean Sibille, Dejan Stosic, Assaf Urieli, Marianne Vergez-Couret
—
Atelier LINGUATEC : Ressources et outils pour le traitement automatique des langues des Pyrénées
12 mai 2021 – En ligne, avec présentations en anglais, espagnol et français, avec traduction simultanée en anglais, espagnol et français.
Cet atelier est organisé par le projet européen EFA 227/16/LINGUATEC “Développement de la coopération transfrontalière et la transfert de connaissances dans le domaine des technologies linguistiques“. Il est ouvert à tous les chercheurs intéressés par le traitement des langues peu dotées, ils pourront y découvrir les travaux réalisés dans le cadre du projet sur le basque et l’occitan, mais aussi sur d’autres langues comme le catalan et le serbe, et des outils génériques pour le traitement des langues.
Pour vous inscrire : www.ixa.eus/events/linguatec
Programme
10h – Ouverture
10h15 Conférences invitées: traitement automatique du catalan
Lluis Padró (Universitat Politècnica de Catalunya)
Morphological and Syntactic Resources in FreeLing
Ressources syntaxiques et morphologiques dans FreeLing
Présentation en anglais – traduction simultanée en espagnol et français
Mariona Taulé (Universitat de Barcelona)
AnCora: un corpus anotado a diferentes niveles lingüístico
AnCora: un corpus marqué à différents niveaux linguistiques
Présentation en espagnol – traduction simultanée en anglais et français
11h15 — Pause
11h30 Présentations : corpus annotés pour l’occitan et le basque et autres langues peu dotées
Assaf Urieli, Joliciel
Talismane, Jochre: automatic syntax analysis and OCR for under-resourced languages
Talismane, Jochre : outils pour l’analyse syntaxique automatique et l’océrisation des langues peu dotées
Présentation en anglais – traduction simultanée en espagnol et français
Aleksandra Miletic y Dejan Stosic, CLLE
Mutualisation des ressources pour la création de treebanks : le cas du serbe et de l’occitan
Présentation en français
Ainara Estarrona (IXA, HiTZ, UPV/EHU)
Construcción del corpus histórico en euskera
Construction du corpus historique en basque
Présentation en espagnol – traduction simultanée en anglais et français
13h — Pause
14h30 Conférence invitée: Réseaux neuronaux
Mans Hulden (University of Colorado)
Neural Networks in Linguistic Research
Présentation en anglais – traduction simultanée en espagnol et français
15h30 Présentation
Rodrigo Agerri (IXA, HITZ, UPV/EHU)
Contextual lemmatization for inflected languages: statistical and deep-learning approaches
Présentation en anglais – traduction simultanée en espagnol et français
16h – Pause
16h15 – Présentations : Résultats du projet LINGUATEC
Myriam Bras, Aleksandra Miletic, Marianne Vergez-Couret, Clamença Poujade, Jean Sibille, Louise Esher, CLLE :
Traitement automatique de l’occitan : construction des premiers corpus annotés
Vidéo en occitan avec sous-titres accessibles dans les autres langues.
Elhuyar
Creación y mejora de los recursos del euskera en el marco de Linguatec
Création et amélioration des ressources basques dans le cadre de Linguatec
Vidéo en basque avec sous-titres accessibles dans les autres langues.
16h45 – Conclusions
Présentation en français et espagnol
17h – Clôture
--
Myriam Bras
Professeur de Linguistique
Université Toulouse Jean Jaurès, CLLE-ERSS
myriam.bras.free.fr