Parution : Corpus, “Bruit de fond ou valeur ajoutée ?”

Parution : Corpus, “Bruit de fond ou valeur ajoutée ?”

Le nouveau numéro de Corpus vient de paraître !

26 | 2025

Bruit de fond ou valeur ajoutée ? 
Gérer le bruit lors des traitements informatiques 
des corpus linguistiques

Elisa Gugliotta, Luca Pallanti, Olivier Kraif, Martina Barletta et Iris Fabry
Introduction 

Loïc Liégeois
Des bruits dans mon corpus : des données à réduire au silence, à atténuer ou à écouter attentivement ?

Valentina B. Lanza
Navigating Noise: A Stratified Model for Scholarly Digital Editions of Arabic Manuscripts in Hebrew Script 

Wim Remysen
Numériser le patrimoine linguistique québécois : l’exemple des fiches dialectologiques de Gaston Dulong 

Ljudmila Petkovic, Caroline Koudoro-Parfait, Marie-Sophie Desmarest et Gaël Lejeune
Quelle solution pour améliorer les performances de la reconnaissance d’entités nommées 
sur des données bruitées, corriger l’entrée ou filtrer la sortie ? 

Thomas Bertin et Gwenolé Quellec
Transcription automatique des interactions verbales. Limites observées et perspectives envisagées à partir d’un corpus de consultations médicales 

Delphine Bernhard et Joanna Dolińska
Managing Noise in Part-of-Speech Tagging for Extremely Low-Resource Languages: Comparing Strategies for Corpus Collection and Annotation in Dagur and Alsatian 

Jonas Noblet
Le bruit dans la mesure de la composante cognitive de l’émotion pour l’évaluation de l’acceptabilité des innovations 

Martina Barletta et Claude Ponton
La question de la normalisation des écrits scolaires pour leur traitement automatique. Le cas de l’omission de mots 

Christian Surcouf
À pas de loup dans la bergerie… La problématique du silence et du bruit dans l’étiquetage automatique du Subjonctif Présent en français parlé

Bénédicte Pincemin
Apprivoiser le « bruit » en linguistique de corpus : expérience d’une analyse factorielle et propositions