Identification de la formation
Code de formation: 
2025-11301
Domaine - Formacode: 
information scientifique et technique

La formation est prévue sur une journée en présentiel.

Matin

- Rappel (rapide) des bases du langage Python
- Manipulation de données tabulaires et statistiques de base avec Pandas
- Construire et améliorer des visualisations avec Matplotlib, Seaborn, Plotly et co
- Aller vers des statistiques avancées avec Statsmodels, Scikitlearn et Prince

Après-midi

- Les outils du Traitement Automatique du Langage en Python (TAL/NLP)
- De l’expression régulière à l’apprentissage automatique
- Usages des modèles de langage, du local à l’API

INTERVENANT

[Émilien Schultz](https://emilienschultz.github.io/), ingénieur de recherche en sciences sociales computationnelles (CREST/ENSAE)

MATERIEL NECESSAIRE

Vous êtes invités à vous munir d’un ordinateur portable.
Si vous n'avez pas d'ordinateur portable, merci de nous le signaler lors de votre inscription, quelques machines seront disponibles sur place (nombre limité).

Contenus pédagogiques
Objectifs: 
Présentation générale Cette formation couvre plusieurs usages de traitement de données en Python courants en sciences humaines et sociales avec une coloration spécifique sur les données textuelles. Pensée comme une journée « avancée », elle s’adresse à un public ayant déjà quelques notions de programmation. Plus précisément, cette formation abordera la mise en place d’analyses statistiques classiques (descriptives et inférentielles, mais aussi mobilisant l’apprentissage automatique), les stratégies pour réaliser et améliorer des visualisations, et une présentation des différentes stratégies existantes de traitement de données textuelles. Les notions seront abordées de manière pratique à travers l’analyse d’un corpus de données. Les participants sont par ailleurs encouragés à amener leur propre jeu de données, et un espace sera consacré à échanger sur les besoins futurs. ​​Objectifs de la formation - Se familiariser avec des bibliothèques centrales de l’écosystème Python pour le traitement de données (Pandas, Scikitlearn, Statsmodels…) - Réfléchir la construction de visualisations avancées (Matplotlib, Plotly, Seaborn…) - Avoir une vue d’ensemble des approches de traitement de données textuelles - Mettre en œuvre différents traitement de données textuelles et familiarisation avec les approches « IA » à partir de modèles Cette formation peut être introduite notamment par la formation [Introduction à Python pour les Sciences Humaines et Sociales](https://sygefor.reseau-urfist.fr/#/training/11300/14166) (en présentiel), le lundi 19/01 (1 j.)
Public visé: 
tout public
Résultats attendus de la formation: 
Présentation générale Cette formation couvre plusieurs usages de traitement de données en Python courants en sciences humaines et sociales avec une coloration spécifique sur les données textuelles. Pensée comme une journée « avancée », elle s’adresse à un public ayant déjà quelques notions de programmation. Plus précisément, cette formation abordera la mise en place d’analyses statistiques classiques (descriptives et inférentielles, mais aussi mobilisant l’apprentissage automatique), les stratégies pour réaliser et améliorer des visualisations, et une présentation des différentes stratégies existantes de traitement de données textuelles. Les notions seront abordées de manière pratique à travers l’analyse d’un corpus de données. Les participants sont par ailleurs encouragés à amener leur propre jeu de données, et un espace sera consacré à échanger sur les besoins futurs. ​​Objectifs de la formation - Se familiariser avec des bibliothèques centrales de l’écosystème Python pour le traitement de données (Pandas, Scikitlearn, Statsmodels…) - Réfléchir la construction de visualisations avancées (Matplotlib, Plotly, Seaborn…) - Avoir une vue d’ensemble des approches de traitement de données textuelles - Mettre en œuvre différents traitement de données textuelles et familiarisation avec les approches « IA » à partir de modèles Cette formation peut être introduite notamment par la formation [Introduction à Python pour les Sciences Humaines et Sociales](https://sygefor.reseau-urfist.fr/#/training/11300/14166) (en présentiel), le lundi 19/01 (1 j.)
Modalités d'alternance: 
pas d'alternance
Conditions spécifiques: 
La formation est pensée pour un public qui a déjà des notions de programmation en langage Python, notamment sa syntaxe et ses principales notions. Il est préférable d’avoir déjà une pratique de traitement de données, et des bases sur les approches statistiques en sciences humaines et sociales.
Déroulement du stage
Modalités d'enseignement: 
Formation entièrement présentielle
Durée (heures): 
7 heures
Période de formation: 
Lu, 02/02/2026
Inscription
Période d`inscription: 
Lu, 02/02/2026 - Di, 01/02/2026
Prise en charge des frais de formation possible: 
Oui
Contact de l'action de formation: 

URFIST de Paris (École nationale des chartes 14 cours des Humanités Bâtiment de recherche Nord, Campus Condorcet 93300 Aubervilliers)

Nom: 
URFIST
Prénom: 
de Paris
Adresse: 
École nationale des chartes 14 cours des Humanités
Adresse: 
Bâtiment de recherche Nord, Campus Condorcet
Code postal: 
93300
Ville: 
Aubervilliers
Département: 
93
Téléphone fixe: 
33 (0)1 88 12 03 07
Web: 
https://urfist.chartes.psl.eu/
Région: 
Île-de-France
Organisme formateur: 
URFIST de Paris
Organisme de formation: 
URFIST de Paris
Domaine - NSF: 
325
Domaine - Rome: 
32214
Niveau à l'entrée en formation: 
Information non communiquée
Niveau à l'entrée en formation obligatoire: 
Non
Formation certifiante: 
Non
Rythme de la formation: 
Temps plein
Modalités d'entrée sortie: 
Entrées / sorties à dates fixes
Langue utilisée lors de la formation: 
Français