Identification de la formation
Code de formation: 
19E14
Thématique: 
Techniques documentaires, outils numériques et compétences informationnelles
Domaine - Formacode: 
bibliothèque documentation

Jour 1
Présentation des enjeux et des apports potentiels d’ISTEX :
1 - les enjeux de la fouille de textes scientifiques ;
2 - le projet ISTEX et ses ressources.
Construire un corpus exploitable : exemple du pré-traitement des collections ISTEX :
1 - enrichissement des métadonnées et indexation des données d’ISTEX
2 - extraction d’un sous corpus d’ISTEX.
Un exemple d’enrichissement des données : les cascades de graphes CasSys pour l'enrichissement de textes scientifiques pour :
1 - principe général ;
2 - application à la détection d’entités nommées ;
3 - autres champs d’application de tels cascades : l’exemple du projet Biosystémique.

Jour 2
Enrichissement du corpus par annotation automatique grâce à l’utilisation d’outils libres : l’exemple de GROBID
1 - les modèles d'apprentissage non supervisés ;
2 - du PDF au XML ;
3 - reconnaissance automatique et balisage des références ;
4 - recherche et balisage d'entités nommées et de mesure physique ;
5 - exemples d’applications.
Gargantext : une plateforme web de text mining.
Les analyses diachroniques d'évolution de concepts et leurs visualisations.

Contenus pédagogiques
Objectifs: 
Le TDM est aujourd'hui un enjeu majeur pour la recherche et pour la documentation, objet de débats politiques dans le cadre de la loi numérique, ayant abouti la création d’un droit à la fouille de données (article 38 de la loi sur une république Numérique). Ce stage vise à illustrer en pratique ce qu'est le TDM sur un corpus de textes. Les notions de base seront abordées et illustrées par des projets de recherche en cours sur le corpus ISTEX et par d'autres recherches mobilisant les mêmes concepts, plusieurs outils seront présentés. Le stage vise à donner aux bibliothécaires et documentalistes une approche concrète de cette pratique de recherche, sachant qu'ils seront dans un avenir proche amenés à accompagner les chercheurs dans ce nouveau champ d'activité dont ISTEX sera certainement l'infrastructure incontournable.
Public visé: 
documentation
Résultats attendus de la formation: 
Attestation de présence
Modalités d'alternance: 
pas d'alternance
Conditions spécifiques: 
Agents intéressés par ces questions
Déroulement du stage
Modalités d'enseignement: 
Formation entièrement présentielle
Lieu (Coordonnées): 
(Lieu exact à définir 75000 Paris)
Durée (heures): 
16
Période de formation: 
Me, 25/09/2019 - Je, 26/09/2019
Inscription
Période d`inscription: 
Ve, 14/12/2018 - Sa, 24/08/2019
Prise en charge des frais de formation possible: 
Oui
Frais restants à la charge du stagiaire: 
350.00 EUR
Contact de l'action de formation: 

Mondon Maguelonne

Nom: 
Mondon
Prénom: 
Maguelonne
Téléphone fixe: 
+33 472114446
Courriel: 
maguelonne.mondon@enssib.fr
Web: 
http://www.enssib.fr/
Domaine - NSF: 
325
Domaine - Rome: 
32214
Niveau à l'entrée en formation: 
Sans niveau spécifique
Niveau à l'entrée en formation obligatoire: 
Non
Formation certifiante: 
Non
Rythme de la formation: 
Temps plein
Modalités d'entrée sortie: 
Entrées / sorties à dates fixes
Langue utilisée lors de la formation: 
Français