Identification de la formation
Code de formation: 
2024-10467
Domaine - Formacode: 
information scientifique et technique

- Rappels théoriques sur les arbres de décision
- Création de scripts R pour les arbres de décision
- Élagage d'un arbre de décision, élimination des problèmes de surajustement
- Mise en œuvre sur des données fournies par le formateur
- Prédire une variable en utilisant des forêts aléatoires, et gérer le cas d’un déséquilibre de classes dans un modèle prédictif
- (Si temps) Mise en œuvre sur les données des stagiaires

Pré-requis :

Des connaissances de base sur le logiciel R (création et manipulation des objets sous R, importation des données, utilisation simple de R en mode console, création de graphiques simples) sont requises.

Il n'est pas nécessaire d'avoir déjà des connaissances théoriques sur les arbres de décision.

Contenus pédagogiques
Objectifs: 
Description générale L'apprentissage automatique par arbre de décision est une méthode moderne de statistique exploratoire et prédictive. Son but est de créer un modèle expliquant la valeur d'une variable-cible (continue ou qualitative) à partir de variables d'entrée pouvant être de différents types (continues, ordinales, nominales). Plus souples et flexibles que les méthodes de régression ou d’analyse discriminante traditionnelles, les arbres de décision sont particulièrement adaptés à des jeux de données comprenant un nombre important de données manquantes. Leur représentation graphique, très visuelle et intuitive, permet également de saisir rapidement des combinaisons de variables intervenant fortement dans un processus donné. Pour cette raison, Associés à une procédure de bootstrap, les arbres de décision peuvent être étendus en une méthode encore plus efficace : les forêts aléatoires. Elles constituent un outil particulièrement puissant en statistique prédictive. Publics Doctorants, enseignants-chercheurs et chercheurs faisant usage de méthodes statistiques. Objectifs - Construire des arbres de décision avec R - Utiliser un arbre de décision depuis des points de vue explicatif et prédictif - Personnaliser des représentations graphiques d'arbres de décision - Découvrir une extension de la méthode : les forêts aléatoires
Public visé: 
tout public
Résultats attendus de la formation: 
Description générale L'apprentissage automatique par arbre de décision est une méthode moderne de statistique exploratoire et prédictive. Son but est de créer un modèle expliquant la valeur d'une variable-cible (continue ou qualitative) à partir de variables d'entrée pouvant être de différents types (continues, ordinales, nominales). Plus souples et flexibles que les méthodes de régression ou d’analyse discriminante traditionnelles, les arbres de décision sont particulièrement adaptés à des jeux de données comprenant un nombre important de données manquantes. Leur représentation graphique, très visuelle et intuitive, permet également de saisir rapidement des combinaisons de variables intervenant fortement dans un processus donné. Pour cette raison, Associés à une procédure de bootstrap, les arbres de décision peuvent être étendus en une méthode encore plus efficace : les forêts aléatoires. Elles constituent un outil particulièrement puissant en statistique prédictive. Publics Doctorants, enseignants-chercheurs et chercheurs faisant usage de méthodes statistiques. Objectifs - Construire des arbres de décision avec R - Utiliser un arbre de décision depuis des points de vue explicatif et prédictif - Personnaliser des représentations graphiques d'arbres de décision - Découvrir une extension de la méthode : les forêts aléatoires
Modalités d'alternance: 
pas d'alternance
Conditions spécifiques: 
Des connaissances de base sur le logiciel R (création et manipulation des objets sous R, importation des données, utilisation simple de R en mode console, création de graphiques simples) sont requises. Il n'est pas nécessaire d'avoir déjà des connaissances théoriques sur les arbres de décision.
Déroulement du stage
Modalités d'enseignement: 
Formation entièrement présentielle
Durée (heures): 
7 heures
Période de formation: 
Ma, 16/04/2024
Inscription
Période d`inscription: 
Ma, 16/04/2024 - Lu, 15/04/2024
Prise en charge des frais de formation possible: 
Oui
Contact de l'action de formation: 

URFIST de Bordeaux (URFIST de Bordeaux, 16 avenue Léon Duguit 33608 PESSAC)

Nom: 
URFIST de Bordeaux
Adresse: 
URFIST de Bordeaux, 16 avenue Léon Duguit
Code postal: 
33608
Ville: 
PESSAC
Téléphone fixe: 
05 56 84 29 19
Fax: 
05 56 84 86 96
Courriel: 
urfist@u-bordeaux.fr
Web: 
weburfist.univ-bordeaux.fr/
Région: 
Aquitaine
Organisme formateur: 
URFIST de Bordeaux
Organisme de formation: 
URFIST de Bordeaux
Domaine - NSF: 
325
Domaine - Rome: 
32214
Niveau à l'entrée en formation: 
Information non communiquée
Niveau à l'entrée en formation obligatoire: 
Non
Formation certifiante: 
Non
Rythme de la formation: 
Temps plein
Modalités d'entrée sortie: 
Entrées / sorties à dates fixes
Langue utilisée lors de la formation: 
Français