Identification de la formation
Code de formation: 
2025-11458
Domaine - Formacode: 
information scientifique et technique

PRE-REQUIS

- aucune expérience de statistiques ou du format XML attendue
- installer sur son ordinateur avant la formation :
- TXM et ses deux extensions 'TreeTagger software' et 'TreeTagger models' (voir la page https://txm.gitpages.huma-num.fr/textometrie/files/software/TXM/0.8.4/#i...)
- Libre Office (https://fr.libreoffice.org)

- venir avec son ordinateur contenant TXM (tout OS)

Déroulé de la journée :

- Se familiariser avec l'interface de TXM et la méthode textométrique
- Initiation aux outils d'analyse documentaire (qualitatifs)
- découverte du corpus exemple VOEUX
- objectif et Propriétés générales du corpus
- lecture et navigation dans les Éditions de textes
- analyse hiérarchique du vocabulaire : Lexique, distribution zipféenne des fréquences
- lecture contextuelle focalisée : Concordances, requêtes CQL et expressions régulières, références, tris, retour au texte
- gestion des fenêtres de résultats dans l'interface
- analyse de vocabulaire focalisé : observables par requêtes CQL (suite), Index de catégories grammaticales, de lemmes ou de séquences de mots
- export de résultats en tableau dans des fichiers tableurs (.xlsx) ou copie dans le presse-papier
- visualisation graphique des occurrences d'observables au fil du corpus (Progression), comparaison entre courbes, liens synchronisés vers les concordances
- export de visualisations graphiques dans des fichiers image (vectoriels ou bitmap)
- relations entre outils : index -> concordance -> édition, index -> progression
- Initiation aux outils d'analyse statistiques (quantitatifs) : partie I
- Cooccurrents statistiques : pivots par requêtes CQL, attirance entre termes, aperçu du modèle des spécificités appliqué aux cooccurrences, concordances de rencontres
- création de configurations de corpus
- isoler un texte ou un groupe de textes : Sous-corpus
- comparer des textes ou des propriétés de textes : Partition
- contraste entre vocabulaires focalisés : Index de Partition
- Table lexicale : tableau de contingence, édition de lignes, export et import vers fichiers tableurs (.xlsx)
- mots Spécifiques à une partie ou à un sous-corpus : introduction au modèle des spécificités, table lexicale, mots spécifiques positifs, mots spécifiques négatifs, mots banals, visualisation graphique de mots spécifiques
- Initiation à la création de corpus : partie I
- introduction aux 4 types de corpus TXM : textes écrits, transcriptions synchronisées, corpus alignés multilingues, corpus en tableaux
- approfondissement sur les corpus de textes écrits
- import I à partir du contenu du presse-papier : déroulé des étapes de l'import, annotation linguistique automatique, parcours rapide du corpus
- import II de corpus de textes bruts (.txt) :
- notion de texte brut, encodage des caractères selon les OS et encodage Unicode
- tableau de métadonnées metadata.xlsx (propriétés de textes)
- import TXT+CSV de la version .txt du corpu

Contenus pédagogiques
Objectifs: 
- Se familiariser avec l'organisation générale et le fonctionnement de l'interface, ainsi qu'avec l'approche textométrique - Utiliser les principales fonctions d'analyse textométrique et de création de corpus de TXM
Public visé: 
tout public
Résultats attendus de la formation: 
- Se familiariser avec l'organisation générale et le fonctionnement de l'interface, ainsi qu'avec l'approche textométrique - Utiliser les principales fonctions d'analyse textométrique et de création de corpus de TXM
Modalités d'alternance: 
pas d'alternance
Conditions spécifiques: 
Non renseigné
Déroulement du stage
Modalités d'enseignement: 
Formation entièrement présentielle
Durée (heures): 
7 heures
Période de formation: 
Me, 22/04/2026
Inscription
Période d`inscription: 
Me, 22/04/2026 - Ma, 21/04/2026
Prise en charge des frais de formation possible: 
Oui
Contact de l'action de formation: 

URFIST de Lyon (20 Avenue Gaston Berger 69603 Villeurbanne)

Nom: 
URFIST de Lyon
Adresse: 
20 Avenue Gaston Berger
Code postal: 
69603
Ville: 
Villeurbanne
Téléphone fixe: 
04 72 43 12 89
Courriel: 
cherifa.boukacem@univ-lyon1.fr
Web: 
urfist.univ-lyon1.fr/
Région: 
Rhône-Alpes
Organisme formateur: 
URFIST de Lyon
Organisme de formation: 
URFIST de Lyon
Domaine - NSF: 
325
Domaine - Rome: 
32214
Niveau à l'entrée en formation: 
Information non communiquée
Niveau à l'entrée en formation obligatoire: 
Non
Formation certifiante: 
Non
Rythme de la formation: 
Temps plein
Modalités d'entrée sortie: 
Entrées / sorties à dates fixes
Langue utilisée lors de la formation: 
Français