Identification de la formation
Code de formation: 
2019-8231
Domaine - Formacode: 
information scientifique et technique

Programme : 5 séances sur un mois et demi à compter de début novembre

1. Rappels sur la programmation en langage Python et usage de la librairie Pandas (3h) - Mercredi 06 novembre 2019 de 9h à 12h

Rappels sur la syntaxe du langage Python, usage avancé du langage Python, usage de la librairie Pandas (gestion de données tabulaires)

2. Reproductibilité, suivi de versions, notebooks Jupyter (3h)- Mercredi 13 novembre 2019 de 13h30 à 16h30

Usage de git et Gitlab pour le versionnement de code, usage des notebooks Jupyter

3. Nettoyage de données (2h) - Jeudi 21 novembre 2019 de 13h30 à 15h30

Emploi de la librairie Pandas, des expressions régulières et de la connaissance d'un jeu de données pour le nettoyer et l'enrichir

4. Visualisation (2h)- Jeudi 28 novembre 2019 de 13h30 à 15h30

Emploi de la librairie Matplotlib pour visualiser des jeux de données

5. Régression linéaire et clustering (3h) - Jeudi 05 décembre 2019 de 13h30 à 16h30

Éléments théoriques et emploi de Scikit-learn pour réaliser des régressions linéaires et des clusterings

Cette formation peut être complétée par des ateliers permettant de travailler avec ses propres données. Voir Parcours Data en sciences humaines et sociales et reproductibilité avec Python - Ateliers (ouverture à partir de janvier 2020)

Contenus pédagogiques
Objectifs: 
Cette formation a pour objectif de donner les fondamentaux pour le traitement des données, leur conservation, leur présentation et le respect des critères de science ouverte. La formation inclut un rappel à la programmation en langage Python. Pré-requis : • Avoir suivi une introduction à la programmation dans un langage scientifique (Python, R, Matlab) • Disposer d’un ordinateur portable ; aucune configuration nécessaire des ordinateurs (emploi d'un serveur distant) • Langue française maitrisée
Public visé: 
tout public
Résultats attendus de la formation: 
Cette formation a pour objectif de donner les fondamentaux pour le traitement des données, leur conservation, leur présentation et le respect des critères de science ouverte. La formation inclut un rappel à la programmation en langage Python. Pré-requis : • Avoir suivi une introduction à la programmation dans un langage scientifique (Python, R, Matlab) • Disposer d’un ordinateur portable ; aucune configuration nécessaire des ordinateurs (emploi d'un serveur distant) • Langue française maitrisée
Modalités d'alternance: 
pas d'alternance
Conditions spécifiques: 
• Avoir suivi une introduction à la programmation dans un langage scientifique (Python, R, Matlab) • Disposer d’un ordinateur portable ; aucune configuration nécessaire des ordinateurs (emploi d'un serveur distant) • Langue française maitrisée
Déroulement du stage
Modalités d'enseignement: 
Formation entièrement présentielle
Durée (heures): 
13 heures
Période de formation: 
Me, 06/11/2019 - Je, 05/12/2019
Inscription
Période d`inscription: 
Me, 06/11/2019 - Ma, 05/11/2019
Prise en charge des frais de formation possible: 
Oui
Contact de l'action de formation: 

URFIST de Strasbourg (34, Boulevard de la Victoire 67070 Strasbourg)

Nom: 
URFIST de Strasbourg
Adresse: 
34, Boulevard de la Victoire
Code postal: 
67070
Ville: 
Strasbourg
Téléphone fixe: 
03 68 85 08 00
Web: 
http://urfist.u-strasbg.fr/
Région: 
Alsace
Organisme formateur: 
URFIST de Strasbourg
Organisme de formation: 
URFIST de Strasbourg
Domaine - NSF: 
325
Domaine - Rome: 
32214
Niveau à l'entrée en formation: 
Information non communiquée
Niveau à l'entrée en formation obligatoire: 
Non
Formation certifiante: 
Non
Rythme de la formation: 
Temps plein
Modalités d'entrée sortie: 
Entrées / sorties à dates fixes
Langue utilisée lors de la formation: 
Français