Programme : Workshop LINGUATEC: Ressources et outils pour les langues peu dotées

Programme : Workshop LINGUATEC: Ressources et outils pour les langues peu dotées

Chers collègues,

Nous avons le plaisir de vous inviter à un workshop en ligne organisé avec nos collègues de l’Univerrsité du Pays Basque à Donostia dans le cadre du projet Linguatec auquel nous participons depuis quatre ans. C’est gratuit, il suffit de s’inscrire (voir ci-dessous).

L’équipe occitane du projet Linguatec du laboratoire CLLE – équipe Langues & langage, UMR 5263, CNRS & Université Toulouse Jean Jaurès

Myriam Bras,  Aleksandra Miletic, Clamença Poujade, Louise Esher, Jean Sibille, Dejan Stosic, Assaf Urieli, Marianne Vergez-Couret

Atelier LINGUATEC : Ressources et outils pour le traitement automatique des langues des Pyrénées

12 mai 2021 – En ligne, avec présentations en anglais, espagnol et français, avec traduction simultanée en anglais, espagnol et français.


Cet atelier est organisé par le projet européen EFA 227/16/LINGUATEC “Développement de la coopération transfrontalière et la transfert de connaissances dans le domaine des technologies linguistiques“. Il est ouvert à tous les chercheurs intéressés par le traitement des langues peu dotées, ils pourront y découvrir les travaux réalisés dans le cadre du projet sur le basque et l’occitan, mais aussi sur d’autres langues comme le catalan et le serbe, et des outils génériques pour le traitement des langues.

Pour vous inscrire : www.ixa.eus/events/linguatec

Programme

10h – Ouverture

10h15 Conférences invitées: traitement automatique du catalan

    Lluis Padró (Universitat Politècnica de Catalunya)
    Morphological and Syntactic Resources in FreeLing
    Ressources syntaxiques et morphologiques dans FreeLing
    Présentation en anglais – traduction simultanée en espagnol et français

    Mariona Taulé (Universitat de Barcelona)
    AnCora: un corpus anotado a diferentes niveles lingüístico
    AnCora: un corpus marqué à différents niveaux linguistiques
    Présentation en espagnol – traduction simultanée en anglais et français

11h15 — Pause

11h30 Présentations : corpus annotés pour l’occitan et le basque et autres langues peu dotées

    Assaf Urieli, Joliciel
    Talismane, Jochre: automatic syntax analysis and OCR for under-resourced languages
    Talismane, Jochre : outils pour l’analyse syntaxique automatique et l’océrisation des langues peu dotées
    Présentation en anglais – traduction simultanée en espagnol et français

    Aleksandra Miletic y Dejan Stosic, CLLE
    Mutualisation des ressources pour la création de treebanks : le cas du serbe et de l’occitan
    Présentation en français

    Ainara Estarrona (IXA, HiTZ, UPV/EHU)
    Construcción del corpus histórico en euskera
    Construction du corpus historique en basque
    Présentation en espagnol – traduction simultanée en anglais et français

13h — Pause

14h30 Conférence invitée: Réseaux neuronaux

    Mans Hulden (University of Colorado)
    Neural Networks in Linguistic Research
    Présentation en anglais – traduction simultanée en espagnol et français

15h30 Présentation

    Rodrigo Agerri (IXA, HITZ, UPV/EHU)
    Contextual lemmatization for inflected languages: statistical and deep-learning approaches
    Présentation en anglais – traduction simultanée en espagnol et français

16h – Pause

16h15 – Présentations : Résultats du projet LINGUATEC

    Myriam Bras, Aleksandra Miletic, Marianne Vergez-Couret, Clamença Poujade, Jean Sibille, Louise Esher, CLLE :
    Traitement automatique de l’occitan : construction des premiers corpus annotés
    Vidéo en occitan avec sous-titres accessibles dans les autres langues.

    Elhuyar
    Creación y mejora de los recursos del euskera en el marco de Linguatec
    Création et amélioration des ressources basques dans le cadre de Linguatec
    Vidéo en basque avec sous-titres accessibles dans les autres langues.

16h45 – Conclusions
   Présentation en français et espagnol

17h – Clôture

-- 
Myriam Bras
Professeur de Linguistique
Université Toulouse Jean Jaurès, CLLE-ERSS
myriam.bras.free.fr