Plan du guide
Opened this issue · 0 comments
larmarange commented
Bases du langage
- Packages
- Vecteurs
- Listes
- Tableaux de données
- Tibbles
- Attributs
Manipulation de données
- Le pipe
- dplyr
- Facteurs et forcats
- Combiner des variables
- Etiquettes de variables
- Etiquettes de valeurs
- Valeurs manquantes
- Import/Export
- Mettre en forme des nombres
- Couleurs & Palettes
Analyses
- Graphiques avec ggplot2
- Analyse univariée et intervalles de confiances
- Analyse bivariée et tests de comparaison
- Echelles de Likert
- Régression linéaire
- Régression logistique binaire
- Sélection pas à pas d'un modèle
- Prédictions marginales, contrastes marginaux & effets marginaux
- Contrastes (variables catégorielles)
- Effets d'interaction
- Multicolinéarité
Données pondérées avec survey
- Définir un plan d'échantillonnage
- Manipulation des données pondérées
- Analyses uni- et bivariées pondérées
- Graphiques pondérés
- Régression logistique binaire pondérée
Manipulations avancées
- Fusion de tables
- Dates avec lubridate
- Chaînes de texte avec stringr
- Conditions logiques (différence & et &&, any(), all(), isTRUE()...)
Astuce :
is_different <- function(x, y) {
(x != y & !is.na(x) & !is.na(y)) | xor(is.na(x), is.na(y))
}
is_equal <- function(x, y) {
(x == y & !is.na(x) & !is.na(y)) | (is.na(x) & is.na(y))
}
- Fonctions à fenêtre
Astuce :
cum_different <- function(x) {
cumsum(is_different(x, lag(x)))
}
- Réorganisation avec tidyr
- Création de fonctions
- Structures conditionnelles
- Transformation multiples (accross)
- Itération avec purrr
- Mise en forme avancée avec gtsummary
- Rapports automatisés avec Rmarkdown
- Rapports automatisés avec quarto
Analyses avancées
- Analyse factorielle
- Classification hiérarchique
- Analyse de survie
- Introduire https://github.com/ddsjoberg/ggsurvfit
- Introduire un modèle à temps discret
- Régression logistique multinomiale
- Régression logistique ordinale
- Modèles de comptage (Poisson & assimilés)
- Modèles d'incidence, de taux
- Modèles de comptage avec surreprésentation des zéros (zero-inflated)
- Modèles de proportions (cf. https://www.andrewheiss.com/blog/2021/11/08/beta-regression-guide/)
- Modèles multiniveaux
- Quel modèle choisir ?
- Imputation de données manquantes (cf. package missMDA)
- Analyse de séquences
- Introduire https://maraab23.github.io/ggseqplot/
Pour aller plus loin
- Autres ressources documentaires