Identification de la formation
Code de formation: 
2026-10349
Domaine - Formacode: 
information scientifique et technique

1. Introduction à l’XML et à la TEIPrésentation du langage XML : principes, usages et intérêts

- Structuration des données, interopérabilité et lisibilité
- Présentation de la Text Encoding Initiative (TEI) : objectifs, principes, communauté
- Différences et complémentarités entre TEI et EpiDoc
- Panorama des outils d’édition XML (Oxygen XML Editor, XML Mind, VS Code, Brackets)

2. Créer une édition scientifique numérique

- Structure générale d’un document TEI
- Présentation du TEI Header et de ses principales sections
- Métadonnées, description des sources et bibliographie
- Définition d’un schéma d’encodage et validation
- Définir un premier balisage adapté à son corpus

3. Enrichir et structurer le contenu

- Encodage du texte principal
- Indexation des personnes et des lieux
- Gestion des références bibliographiques
- Intégration de fac-similés et de descriptions de supports
- Introduction à la validation par schéma (DTD, Relax NG, ODD, Roma)

4. Travaux pratiques

- Encodage d’un texte de référence en TEI
- Encodage d’un support d’inscription en EpiDoc
- Encodage des entités et alignement vers les référentiels internes et externes
- Validation des documents

Pré-requis

- Ordinateur personnel
- Installation ou accès à Oxygen XML Editor (licence institutionnelle ou version d’essai). A défaut, droits suffisants pour effectuer l’installation lors de la formation
- Supports de cours, fichiers d’exercices et exemples seront fournis
- Aucune connaissance préalable en XML ou TEI n’est requise
- Une familiarité avec les problématiques de corpus et d’édition scientifique est recommandée

Contenus pédagogiques
Objectifs: 
Née en 1987, la Text Encoding Initiative (TEI) est une norme de balisage, de notation et d'échange de corpus des documents électroniques. Cette formation vise à fournir une initiation pratique et méthodologique à l’encodage de textes en XML-TEI dans le cadre de projets d’édition scientifique numérique en sciences humaines et sociales. À l’issue de la formation, les participants seront en mesure de comprendre les principes fondamentaux de l’XML et de la TEI, de définir un schéma de balisage adapté à leur corpus, d’encoder un texte selon les recommandations TEI ou EpiDoc, de valider cet encodage et de produire des formes de publication numérique à partir des données encodées. Compétences visées À l’issue de la formation, les participantes seront capables de : - comprendre les principes de structuration des données en XML ; - identifier les apports et usages de la TEI et d’EpiDoc pour l’édition scientifique numérique ; - concevoir la structure générale d’un document TEI (TEI Header, texte, métadonnées) ; - définir et appliquer des règles de balisage adaptées à un corpus ; - valider un document TEI à l’aide d’un schéma ; - encoder des entités (personnes, lieux), des références bibliographiques et des fac-similés.
Public visé: 
tout public
Résultats attendus de la formation: 
Née en 1987, la Text Encoding Initiative (TEI) est une norme de balisage, de notation et d'échange de corpus des documents électroniques. Cette formation vise à fournir une initiation pratique et méthodologique à l’encodage de textes en XML-TEI dans le cadre de projets d’édition scientifique numérique en sciences humaines et sociales. À l’issue de la formation, les participants seront en mesure de comprendre les principes fondamentaux de l’XML et de la TEI, de définir un schéma de balisage adapté à leur corpus, d’encoder un texte selon les recommandations TEI ou EpiDoc, de valider cet encodage et de produire des formes de publication numérique à partir des données encodées. Compétences visées À l’issue de la formation, les participantes seront capables de : - comprendre les principes de structuration des données en XML ; - identifier les apports et usages de la TEI et d’EpiDoc pour l’édition scientifique numérique ; - concevoir la structure générale d’un document TEI (TEI Header, texte, métadonnées) ; - définir et appliquer des règles de balisage adaptées à un corpus ; - valider un document TEI à l’aide d’un schéma ; - encoder des entités (personnes, lieux), des références bibliographiques et des fac-similés.
Modalités d'alternance: 
pas d'alternance
Conditions spécifiques: 
Non renseigné
Déroulement du stage
Modalités d'enseignement: 
Formation entièrement présentielle
Durée (heures): 
6 heures
Période de formation: 
Ma, 05/05/2026
Inscription
Période d`inscription: 
Ma, 05/05/2026 - Lu, 04/05/2026
Prise en charge des frais de formation possible: 
Oui
Contact de l'action de formation: 

URFIST de Lyon (20 Avenue Gaston Berger 69603 Villeurbanne)

Nom: 
URFIST de Lyon
Adresse: 
20 Avenue Gaston Berger
Code postal: 
69603
Ville: 
Villeurbanne
Téléphone fixe: 
04 72 43 12 89
Courriel: 
cherifa.boukacem@univ-lyon1.fr
Web: 
urfist.univ-lyon1.fr/
Région: 
Rhône-Alpes
Organisme formateur: 
URFIST de Lyon
Organisme de formation: 
URFIST de Lyon
Domaine - NSF: 
325
Domaine - Rome: 
32214
Niveau à l'entrée en formation: 
Information non communiquée
Niveau à l'entrée en formation obligatoire: 
Non
Formation certifiante: 
Non
Rythme de la formation: 
Temps plein
Modalités d'entrée sortie: 
Entrées / sorties à dates fixes
Langue utilisée lors de la formation: 
Français