- Panorama TDM pour comprendre en quoi le TDM peut aider un chercheur dans ses travaux (1h)
- Construction d’un corpus spécialisé à partir des ressources ISTEX (2h)
Les participants pourront découvrir les outils et services ISTEX et s’approprier les méthodes de constitution de corpus à travers des exemples de corpus réalisés par l’Inist.
Cette demi-journée proposera une approche à la fois théorique et pratique autour de l’interrogation d’ISTEX, à travers la construction d’une requête avec le démonstrateur, et l’extraction des résultats, à l’aide du service de téléchargement ISTEX-DL.
A l’issue de cette matinée, les participants sauront interroger la base ISTEX pour construire et télécharger leur propre corpus.
Après-midi : TP à partir d’un cas d’usage
- Construction d’une requête pour interroger ISTEX et téléchargement du corpus avec ISTEX-DL (1h)
- Exploration du corpus dans LODEX pour affiner la requête (1h)
- Analyse du corpus avec les Web Services TDM de l’Inist pour répondre à la question posée par le cas d’usage (2h)
LODEX est un outil open-source dédié à la valorisation et à la visualisation de données structurées. Il permet d’explorer le contenu d’un corpus et de l’analyser afin d’en évaluer sa qualité.
Cet atelier permettra de poursuivre la démarche de constitution de corpus initiée le matin, en explorant le corpus téléchargé avec ISTEX-DL. Il sera proposé différentes manipulations conduisant à affiner la requête, afin de limiter les étapes de post-traitement des résultats et ainsi obtenir un corpus finalisé en vue d’une utilisation dans un outil de fouille de textes.