Statistiques et Probabilités avec R et le Tidyverse

Un livre portant sur les statistiques et les probabilités en utilisant R et le tidyverse.

Le livre se trouve à l'adresse https://desautm.github.io/tidystatR/

Le but de ce livre est de tenter d'arrimer certains des contenus vus dans les cours de statistiques et de probabilités au collégial avec les nouveaux outils informatiques disponibles. Les enseignants du collégial, pour la plupart, donnent encore leurs cours de statistiques de la même façon qu'il y a 30 ans. Je crois qu'il est primordial d'équiper nos étudiants à l'utilisation des outils informatiques en insistant moins sur la production de graphiques, de calculs, de tests d'hypothèses à la main, mais plutôt d'insister sur la compréhension et sur les conclusions que nous pouvons tirer de nos données.

La compétence 022P

Énoncé de la compétence

Appliquer des outils statistiques à l’interprétation de données reliées à des contextes d’études en sciences humaines.

Contexte de réalisation

En utilisant, entre autres, des données publiques ou privées à l’usage des sciences humaines.
- Plusieurs librairies disponibles dans R contenant des données publiques et privées:
  - gapminder
  - gss_cat dans forcats
  - nycflights13
  - etc.
À l’aide, entre autres, d’un logiciel approprié au traitement de données et d’une calculatrice permettant le traitement statistique à deux variables.
- Nous pouvons utiliser R avec RStudio et l'usage de la calculatrice n'est pas nécessaire

Éléments de la compétence et critères de performance

Situer l’analyse des données, en particulier leur interprétation, à l’intérieur de la démarche scientifique en sciences humaines.
1. Utilisation juste des notions et du vocabulaire appropriés.
  - L'utilisation juste des notions est un élément essentiel. Il ne faut pas seulement apprendre aux étudiants à faire les choses, mais plutôt leur apprendre à utiliser les bonnes notions dans les bonnes situations.
  - Le vocabulaire peut être appris en établissant des liens avec R
2. Distinction des types de variables et des échelles de mesure.
  - On peut le faire...
3. Identification plausible de la méthode d’échantillonnage utilisée d’après un échantillon observé de la population visée.
Présenter des données sous des formes adéquates.
1. Organisation judicieuse de données sous forme de tableaux et de graphiques.
Analyser des données à l’aide de différentes mesures.
1. Utilisation correcte et interprétation des mesures de tendance centrale, de dispersion et de position.
2. Utilisation correcte et interprétation de taux, de proportions, de pourcentages, d’indices, de ratios et des mesures de variation dans le temps.
Établir la nature et l’intensité du lien entre des variables.
1. Vérification formelle de la présence d’un lien statistique entre deux variables, par le test d’indépendance du khi-carré, et qualification de l’intensité du lien à l’aide d’un coefficient approprié.
2. Identification de la présence d’un lien linéaire entre deux variables à partir d’un nuage de points, du coefficient de corrélation linéaire, et description du lien à l’aide de la droite de régression.
Estimer des paramètres d’une population à partir des statistiques correspondantes obtenues sur un échantillon.
1. Estimation par intervalle d’une moyenne et d’une proportion dans une population, en tenant compte du niveau de confiance.
2. Lecture critique de textes comportant de l’information de nature quantitative.

Bookdown