Formation R pour les statistiques avancées
Résumé
Logiciel : R
Durée : 21 heures
Objectifs :
– Acquérir des compétences avancées dans l’analyse des données avec R.
– Être en capacité de réaliser des analyses statistiques spécifiques (régressions, analyses de variance, analyses multivariées).
– Construire des représentations graphiques complexes en lien avec les analyses descriptives abordées dans le niveau 1 et avec les procédures statistiques étudiées dans ce niveau 2a.
– Consolider les compétences d’analyse, d’exploration et de représentation des données dans le but de développer par la suite des savoir-faire encore plus avancés par eux-mêmes ou à travers des formations complémentaires.
Pré-requis : les participants doivent connaître les aspects théorique généraux des procédures abordées (notions fondamentales des méthodes de régression linéaire / non-linéaire / logistique, ANOVA, Analyses multivariées / Analyse factorielle / Analyse en Composantes Principales). Il n’est pas obligatoire d’avoir une expérience régulière avec d’autres outils logiciels de Statistique. Les participants doivent avoir acquis les compétences correspondant au programme du Niveau 1 de la "Formation R pour les analyses statistiques". Les groupes seront idéalement homogènes en termes de compétences préalables mais une certaine hétérogénéité peut être envisagée si le groupe est bien soudé et les participants très motivés.
Public : Toute personne ou groupe de personnes ayant à traiter numériquement des données qualitatives ou quantitatives dans le cadre de leur activité professionnelle quel que soit leur niveau d’études et ayant besoin de mettre en œuvre des méthodes avancées en statistique ou en représentation graphique des données.
Méthodes mobilisées : Alternance d’apports théoriques et d’exercices de mise en application pratique. Les notions décrites sont mise en pratique en permanence en parallèle au cours. Chaque demi-journée est ponctuée d’exercices simples qui sont directement en lien avec le thème de la demi-journée. La dernière demi-journée est consacrée à un exercice complet nécessitant la mise en œuvre synthétique en semi-autonomie des compétences acquises sur l’ensemble de la formation.
Modalités et délais d’accès : Sur inscription préalable au minimum 1 semaine avant le début de la formation selon disponibilité du formateur.
Modalités d’évaluations : Une évaluation du niveau des stagiaires est réalisée avant l’entrée en formation par téléphone ou au moyen d’un questionnaire. Évaluation des acquis et de la satisfaction en fin de formation.
Accessibilité aux personnes en situation de handicap ou présentant des difficultés d’apprentissage : nous pouvons proposer des solutions de compensation de nos prestations en adaptant les moyens pédagogiques, techniques et d’encadrement (les précisions).
Taux de satisfaction 2i2L : 96,34 % des stagiaires sont satisfaits à l’issue de leur formation.
Tarif : pour une demande de formation interne, nous consulter.
Présentation
R est un logiciel libre de traitement de données et d’analyse statistique mettant en œuvre le langage de programmation S [1].
– le site Web officiel du logiciel R
– le logiciel R est distribué sous licence GNU GPLv2
– et soutenu par la Fondation R
– l’article Wikipédia du logiciel R
Programme
Vérification des acquis du Niveau 1 :
– les principaux objets du langage
– les statistiques descriptives
– les bases sur les graphiques
– le chargement d’extensions
Régression :
– l’expression des relations entre variables
– la régression linéaire simple
– l’exploration graphique, les intervalles de Confiance
– la régression linéaire multiple
– la régression non-linéaire
Analyse de variance :
– l’expression des relations entre variables
– l’ANOVA
– les effets d’interaction, spécification des contrastes
– l’ANOVA à mesures répétées
– l’ANOVA avec plans déséquilibrés
Graphiques avancés avec R :
– les graphiques multiples
– le contrôle des paramètres graphiques
– la gestion des axes
– la gestion des couleurs
– la superposition de données, barres d’erreur
– les graphiques en grille (lattice) et représentations 3D
Analyses multivariées :
– les variables continues
– les variables catégorielles
– les combinaisons de variables catégorielles et continues
– les représentations graphiques
Exercice récapitulatif :
– la statistique descriptive
– la régression, la statistique inférentielle et l’analyse multivariée
– l’exploration et la représentation graphique