Corpus SERMO

Corpus SERMO

Vous trouverez sur le site http://sermo.unine.ch un corpus de 62 sermons protestants francophones, édités pour la plupart à Genève, entre 1550 et 1750, représentant 600571 tokens.

Ces textes ont été tokenisés, lemmatisés et étiquetés,  et permettent des requêtes dans différents domaines, comme l’histoire du livre, de l’imprimerie, la théologie, l’histoire des idées, la littérature moderne, la linguistique de corpus et la linguistique diachronique.

Rechercher la graphie moderne et trouver toutes les graphies anciennes qui y correspondent ; rechercher des citations bibliques, selon leur référence, ou la bible source dont ils sont tirés ; établir une base de collocation pour des lemmes ou des tokens choisis ; visualiser les résultats des requêtes…

Par exemple, voici l’évolution du nombre de phrases commençant par une conjonction de coordination en 1550 et 1750 :

Distribution basé sur: $classification_desc

De nombreux tutoriels sont à votre disposition pour apprendre à faire des requêtes plein-texte, par concordancier, par fréquence, etc. Les textes, les résultats et les outils sont tous téléchargeables gratuitement.

Pour toute question ou renseignement, vous pouvez vous adresser à Carine Skupien Dekens <carine.skupien-dekens(at)unine.ch>.