Le volet numérique du projet SETAF entend publier l’édition critique numérique d'un ouvrage (Les Faits), un catalogue raisonné de ses gravures et un corpus de textes de l’époque de la Réforme, comprenant des textes écrits et réédités par Guillaume Farel (1489-1565) et son cercle. Le corpus primaire comprend les ouvrages publiés par les imprimeurs Pierre de Vingle et Jean Michel, actifs respectivement dans les années 1525-1535 et 1538-1545, entre Genève et Neuchâtel. Ce corpus numérique permettra de développer des outils d’analyse textuelle spécifiques pour la Réforme francophone et des modèles pour le traitement automatique des imprimés du XVIe siècle en langue française. Une importante dimension numérique est donc prévue pour la réalisation de ce projet, avec l'océrisation de nombre d’imprimés d’une part et l’exploitation computationnelle de ces données d’autre part.
Un site consacré à ce volet numérique est en cours de construction.
GitHub du projet : https://github.com/SETAFDH
Site du projet : https://www.unige.ch/setaf
Ce projet est financé par le Fonds national suisse (FNS). Numéro de projet : 205056.
Les dépôts suivants comprennent les textes en XML-TEI du corpus du projet SETAF :
Les données sont identiques dans les deux dépôts.
Les dépôts suivants comprennent les données OCR du corpus du projet SETAF :
- HTR-SETAF-Pierre-de-Vingle (caractères gothiques)
- HTR-SETAF-Jean-Michel (caractères gothiques)
- HTR-SETAF-LesFaictzJCH (caractères gothiques et romains)
- SETAF-autres-romain (caractères romains)
- SETAF-autres-gothique (caractères gothiques)
Le dépôt Annotation-linguistique-SETAF comprend les données d'annotation linguistique du corpus du projet SETAF.
Notre modèle d'OCR, CATMuS Gothic Print, est disponible sur Zenodo : 10599911.
Notre modèle de normalisation, FreEM SemiD norm model, est disponible sur Zenodo : 15551750.
Sonia Solfrini, Geneviève Gross, Brigitte Roux, Nathalie Szczech, Pierre-Olivier Beaulnes, Aurélia Marques Oliveira, Daniela Solfaroli Camillocci. « Étudier le ‘groupe de Neuchâtel’ : de l'édition des Faits à un corpus numérique de la première Réforme romande », Humanistica 2023, Association francophone des humanités numériques, juin 2023, Genève, Suisse. ⟨hal-04097381⟩.
Sonia Solfrini, Simon Gabay, Geneviève Gross, Pierre-Olivier Beaulnes, Aurélia Marques Oliveira, Daniela Solfaroli Camillocci. « Guide de transcription pour les imprimés français du XVIe siècle en caractères gothiques », document de travail, version A, novembre 2023. ⟨hal-04281804⟩.
Sonia Solfrini, Simon Gabay, Maxime Humeau, Ariane Pinche, Pierre-Olivier Beaulnes, Aurélia Marques Oliveira, Geneviève Gross, Daniela Solfaroli Camillocci. « Océriser les imprimés du XVIe siècle en langue française : le cas d’un corpus romand en caractères gothiques », Humanistica 2024, Association francophone des humanités numériques, mai 2024, Meknès, Maroc. ⟨hal-04555002⟩.
Sonia Solfrini, Mylène Dejouy, Aurélia Marques Oliveira, Pierre-Olivier Beaulnes. « Normaliser le moyen français : du graphématique au semi-diplomatique », actes de CORIA-TALN-RJCRI-RECITAL 2025, juillet 2025, Marseille, France. ⟨hal-05137564⟩.
à venir