Contrat de recherche postdoctoral en TAL et/ou linguistique outillée (TAL)
Le programme scientifique ArchivU annonce l’ouverture d’un contrat postdoctoral à temps plein sur 12 mois. Le postdoctorant ou la postdoctorante doit être titulaire d’un doctorat en traitement automatique des langues ou en linguistique outillée et avoir une expérience confirmée dans le traitement de données textuelles numériques.
Contexte de la recherche
Le projet ArchivU se donne pour but d’analyser les mutations de l’institution universitaire et du travail scientifique sur une diachronie courte, des années 1970 à nos jours, via l’analyse de deux genres textuels où se joue l’activité de l’université dans sa diversité : les comptes rendus des réunions du conseil d’administration et les rapports des laboratoires. Programme interdisciplinaire réunissant linguistes, historiens, philosophes, sociologues et conservateurs, ArchivU s’attache ainsi spécifiquement à des sources archivistiques encore largement inexploitées qui lui fournissent son corpus premier.
Le corpus ArchivU comprend l’intégralité des comptes rendus de l’université de Nanterre et de l’UPEC de 1971 à 2018 ainsi qu’une sélection de rapports de laboratoire de l’université de Nanterre depuis les années 1970. Ce corpus est destiné à être enrichi par trois niveaux de balisage : un balisage physiquepermettant de mettre en évidence la structure physique du texte ; un balisage sémantique, en partie automatisé, visant entre autres les entités nommées (noms de personnes, de lieux, dates, etc.) ; et une première ébauche de balisage linguistique fin des marqueurs caractéristiques des genres de discours étudiés (par exemple le discours rapporté et plus largement la polyphonie énonciative).
Les missions proposées pour ce poste :
Dans le cadre de la recherche ArchivU, le postdoctorant /la postdoctorante sera amené à proposer un projet de recherche en relation avec l’enrichissement et l’analyse du corpus ArchivU. La mission consistera à réaliser des tâches variées telles que :
-Établissement, structuration, et nettoyage des données (correction des sorties OCR et encodage XML) ;
– Prise en main/adaptation d’un outil d’annotation manuelle multi-utilisateur et de guides d’annotation
– Analyse des données avec une approche en statistiques textuelles
– Gestion et documentation des données et (méta)données sur la base d’un protocole préexistant à reproduire ;
– Mise en place d’outils de détection automatique à but d’enrichissement du corpus en rapport avec des marqueurs caractéristiques des genres de discours étudiés (type fine-tuning de LLM pour la détection et le balisage linguistique fin) ;
– Participation aux activités de publication et communication de l’équipe
– Formation des équipes aux méthodes et à l’utilisation des outils.
Where to apply
-
frederique.sitri@u-pec.fr
Requirements
- Research Field
- Language sciences » Linguistics
- Education Level
- PhD or equivalent
- Research Field
- Computer science » Modelling tools
- Education Level
- PhD or equivalent
Skills/Qualifications
– Python programming skills for NLP (sklearn, Pytorch, Tensoflow…)
– experience of annotation for NLP (management of an annotation campaign)
-experience in processing XML files
– ability to write and present academic documents;
– fluency in French as main working language;
– ability to work independently as part of a multidisciplinary research team
– ability to prioritize tasks and take initiative
PhD in language sciences or computer science, specializing in natural language processing or quantitative linguistics;
- Languages
- FRENCH
- Level
- Excellent
- Research Field
- Language sciences » Linguistics
- Years of Research Experience
- 1 – 4
- Research Field
- Computer science » Modelling tools
- Years of Research Experience
- 1 – 4
Additional Information
PhD in language sciences or computer science, specializing in natural language processing or quantitative linguistics ;
How to apply :
Applications must include :
– contact details (e-mail, telephone) ;
– an up-to-date CV with a list of publications;
– a cover letter including research project ideas in line with the job description;
– a relevant academic text and/or research project.
Application procedure:
– The deadline for applications is July 10, 2024.
– The complete application must be sent by e-mail to frederique.sitri@u-pec.fr with the heading “candidature Post-doc ARCHIVU”.
– Applications will be considered complete once all elements have been received.
Recruitment procedure
A shortlist of candidates will be invited to an interview, which will take place between July 11 and 18, 2024.
Contact
– Frédérique Sitri (frederique.sitri@u-pec.fr) and Hugo Dumoulin (hdumoulin@parisnanterre.fr).
Work Location(s)
- Number of offers available
- 1
- Company/Institute
- Université Paris-Est Créteil
- Country
- France
- State/Province
- Ile-de-France
- City
- Créteil
- Postal Code
- 94000