Skip to content
@SETAFDH

SETAFDH

Projet SETAF

Projet

Le volet numérique du projet SETAF entend publier l’édition critique numérique d'un ouvrage (Les Faits), un catalogue raisonné de ses gravures et un corpus de textes de l’époque de la Réforme, comprenant des textes écrits et réédités par Guillaume Farel (1489-1565) et son cercle. Le corpus primaire comprend les ouvrages publiés par les imprimeurs Pierre de Vingle et Jean Michel, actifs respectivement dans les années 1525-1535 et 1538-1545, entre Genève et Neuchâtel. Ce corpus numérique permettra de développer des outils d’analyse textuelle spécifiques pour la Réforme francophone et des modèles pour le traitement automatique des imprimés du XVIe siècle en langue française. Une importante dimension numérique est donc prévue pour la réalisation de ce projet, avec l'océrisation de nombre d’imprimés d’une part et l’exploitation computationnelle de ces données d’autre part.

Un site consacré à ce volet numérique est en cours de construction.

GitHub du projet : https://github.com/SETAFDH

Site du projet : https://www.unige.ch/setaf

Financeur

Ce projet est financé par le Fonds national suisse (FNS). Numéro de projet : 205056.


TEI Publisher

Données TEI

Les dépôts suivants comprennent les textes en XML-TEI du corpus du projet SETAF :

Les données sont identiques dans les deux dépôts.

Données OCR

Les dépôts suivants comprennent les données OCR du corpus du projet SETAF :

Données d'annotation linguistique

Le dépôt Annotation-linguistique-SETAF comprend les données d'annotation linguistique du corpus du projet SETAF.


Modelès d'IA

Notre modèle d'OCR, CATMuS Gothic Print, est disponible sur Zenodo : 10599911.

Notre modèle de normalisation, FreEM SemiD norm model, est disponible sur Zenodo : 15551750.

Publications

Sonia Solfrini, Geneviève Gross, Brigitte Roux, Nathalie Szczech, Pierre-Olivier Beaulnes, Aurélia Marques Oliveira, Daniela Solfaroli Camillocci. « Étudier le ‘groupe de Neuchâtel’ : de l'édition des Faits à un corpus numérique de la première Réforme romande », Humanistica 2023, Association francophone des humanités numériques, juin 2023, Genève, Suisse. ⟨hal-04097381⟩.

Sonia Solfrini, Simon Gabay, Geneviève Gross, Pierre-Olivier Beaulnes, Aurélia Marques Oliveira, Daniela Solfaroli Camillocci. « Guide de transcription pour les imprimés français du XVIe siècle en caractères gothiques », document de travail, version A, novembre 2023. ⟨hal-04281804⟩.

Sonia Solfrini, Simon Gabay, Maxime Humeau, Ariane Pinche, Pierre-Olivier Beaulnes, Aurélia Marques Oliveira, Geneviève Gross, Daniela Solfaroli Camillocci. « Océriser les imprimés du XVIe siècle en langue française : le cas d’un corpus romand en caractères gothiques », Humanistica 2024, Association francophone des humanités numériques, mai 2024, Meknès, Maroc. ⟨hal-04555002⟩.

Sonia Solfrini, Mylène Dejouy, Aurélia Marques Oliveira, Pierre-Olivier Beaulnes. « Normaliser le moyen français : du graphématique au semi-diplomatique », actes de CORIA-TALN-RJCRI-RECITAL 2025, juillet 2025, Marseille, France. ⟨hal-05137564⟩.

Citer le projet

à venir

Popular repositories Loading

  1. TEI-SETAF TEI-SETAF Public

    Données TEI dans le cadre du projet SETAF

    HTML 1

  2. HTR-SETAF-Pierre-de-Vingle HTR-SETAF-Pierre-de-Vingle Public

    Données OCR dans le cadre du projet SETAF

  3. .github .github Public

    Projet SETAF

  4. HTR-SETAF-LesFaictzJCH HTR-SETAF-LesFaictzJCH Public

    Données OCR dans le cadre du projet SETAF

  5. HTR-SETAF-Jean-Michel HTR-SETAF-Jean-Michel Public

    Données OCR dans le cadre du projet SETAF

  6. Annotation-linguistique-SETAF Annotation-linguistique-SETAF Public

    Données d'annotation linguistique du projet SETAF

Repositories

Showing 10 of 11 repositories

Top languages

Loading…

Most used topics

Loading…