Vous tentez d’étudier un processus sans a priori spécifique et vous avez mesuré un nombre important de variables que vous pensez potentiellement impliquées. Comment trier et garder l’information pertinente ?
Dans ce contexte, nous proposons deux formations indépendantes, se déroulant en deux sessions de trois heures, au cours desquelles nous aborderons différentes méthodes pertinentes pour éclairer cette question, aussi bien dans leurs aspects théoriques que pratiques, avec R.
Cette première session se concentre plus particulièrement sur deux approches statistiques traditionnelles permettant de sélectionner les variables pertinentes en analyse exploratoire : la comparaison de modèles multivariés et les méthodes de réduction de dimensions, comme l’analyse en composantes principales et la régression Partial Least Squares.
Objectifs de la formation :
• Estimer, comparer et évaluer différents modèles linéaires.
• Estimer les composantes principales, visualiser et interpréter les dimensions pertinentes.
• Évaluer la pertinence de ces modèles.
• Identifier les variables pertinentes à partir des résultats de ces modèles.
Prérequis :
• Quelques notions en statistique (tests de base, modèle de régression linéaire, ANOVA).
• Notions de base en langage R.
• Ordinateur personnel équipé de R (version ≥ 4.0.x), des packages nécessaires (indiqués après inscription) et d’un IDE tel que RStudio.
Ne manquez pas cette occasion ! [Inscrivez-vous ici !]
Possibilité de venir à partir de 13h15 pour une assistance à l’installation des outils.
Une autre session de formation aborde des méthodes issues du machine learning : régressions régularisées, arbres et forêts aléatoires. N’hésitez pas à vous inscrire.
Il y a 5 questions dans ce questionnaire.