Formation : séminaire intensif “Méthodes en linguistique de corpus – Compilation, annotation et analyse quantitative, du 3 au 7 juin 24

Formation : séminaire intensif “Méthodes en linguistique de corpus – Compilation, annotation et analyse quantitative, du 3 au 7 juin 24

Formation  : séminaire intensif

Méthodes en linguistique de corpus – Compilation, annotation et analyse quantitative, du 3 au 7 juin 24

L’Université Paris 8, avec le soutien de European Reform University Alliance, a le plaisir de vous annoncer l’ouverture prochaine du Séminaire Intensif «Méthodes en Linguistique de Corpus–compilation, annotation et analyse quantitative », qui aura lieu du 03 à 07 juin 2024.

Ce programme, d’une durée d’une semaine, comprend 30h de cours répartis de la manière suivante :
–le matin, des séances consacrées à la récolte et à la préparation des données
–l’après-midi, des cours dédiés à l’analyse statistique des données récoltées lors des séances du matin
–plusieurs demi-journées d’entraînement à l’annotation automatique, manuelle ou multimodale.

Les participants apprendront à :
–concevoir des formules de recherche complexes dans un concordancier (TextSTAT)
–rassembler un corpus thématique avec BootCaT
–étiqueter un corpus de texte automatiquement avec TreeTagger
–annoter un corpus de texte manuellement dans UAM CorpusTool
–mesurer la spécificité des mots clefs et la force des collocations dans AntConc
–réaliser des analyses statistiques exploratoires (analyse des correspondances, analyse factorielle, analyse de clusters) dans R
–réaliser des analyses statistiques confirmatoires (log-linéaire, régression) dans R

Ce programme s’adresse principalement à des enseignants-chercheurs et étudiants de deuxième ou troisième cycle (Master, Doctorat).  Les frais de participation seront de 90€ (gratuit pour les participants de Paris 8).

Nous attendons plus de demandes que nous pourrons accepter et donc pour y participer, nous vous demandons de remplir ce formulaire en ligne :

Pour tout complément d’information :
Dylan Glynn and Daniel Henkel /


University Paris 8, with the support of the European Reform University Alliance, is pleased to announce their upcoming Summer School:

Corpus Methods in Linguistics–compilation, annotation and quantitative
03-07 June 2024.

This will be a 30h week-long course consisting of:
–morning sessions devoted to data collection, extraction and organization, as well as DIY corpus building
–afternoon sessions focusing on statistical analysis of the data produced during the morning sessions
–several half-day sessions on automatic annotation and manual annotation methods
Participants will learn how to:
–formulate advanced search queries in a concordancer in TextSTAT
–compile a text corpus with BootCaT
–automatically annotate a text corpus in TreeTagger
–manually annotate a text corpus in UAM CorpusTool
–measure keyword specificity and collocation strength using AntConc
–perform exploratory statistical techniques for complex data using correspondence analysis, factor analysis, and cluster analysis in R
–perform confirmatory statistical techniques for complex data using log-linear analysis and regression modelling in R
This program is intended primarily for researchers and upper-level students (Masters or Doctorate).
Tuition will be 90€ (free for students from universities participating in the ERUA scheme, including Paris 8).

Normally, we receive more requests than we can accept, so if you wish to participate, please fill in this form –
If you have any questions, please feel free to contact us.
Dylan Glynn and Daniel Henkel /