Statistiques

Caractéristiques de position d’une série statistique

Série statistique et effectifs

Définition
• Une **série statistique** est l'ensemble des données collectées lors de l'étude d'un caractère (qualitatif ou quantitatif) sur une population donnée. • L'**effectif total**, noté $N$, est le nombre total d'individus de la population étudiée. • L'**effectif** d'une valeur est le nombre de fois que cette valeur apparaît dans la série. La **fréquence** $f_i$ d'une valeur est le rapport de son effectif $n_i$ par l'effectif total $N$ : \[ f_i = \frac{n_i}{N} \]

Moyenne d’une série statistique

Définition
La **moyenne** (notée $\bar{x}$) d'une série statistique dont les valeurs du caractère sont $x_1, x_2, \dots, x_k$ et les effectifs correspondants sont $n_1, n_2, \dots, n_k$ est égale à : \[ \bar{x} = \frac{n_1 x_1 + n_2 x_2 + \dots + n_k x_k}{n_1 + n_2 + \dots + n_k} = \frac{\sum_{i=1}^{k} n_i x_i}{N} \]
Propriété
[Linéarité de la moyenne] Si une série de valeurs $x_i$ a pour moyenne $\bar{x}$, alors la série de valeurs $a x_i + b$ (où $a$ et $b$ sont deux réels) a pour moyenne : \[ \overline{ax + b} = a\bar{x} + b \]
Application
Une série de trois notes a une moyenne $\bar{x} = 3$. Si l'on multiplie chaque note par $2$ et qu'on soustrait $5$, déterminer la nouvelle moyenne de la série en utilisant la propriété de linéarité.

Médiane et quartiles

Définition
On considère une série statistique dont les valeurs sont ordonnées dans le sens croissant :
  • La **médiane**, notée $Me$, est un nombre réel qui partage la population en deux parties de même effectif. Au moins 50\,\% des individus ont une valeur inférieure ou égale à $Me$, et au moins 50\,\% ont une valeur supérieure ou égale à $Me$.
  • Le **premier quartile**, noté $Q_1$, est la plus petite valeur de la série telle qu'au moins 25\,\% de l'effectif total soit inférieur ou égal à $Q_1$.
  • Le **troisième quartile**, noté $Q_3$, est la plus petite valeur de la série telle qu'au moins 75\,\% de l'effectif total soit inférieur ou égal à $Q_3$.
Exercice
Voici les notes obtenues par un élève au cours d'un trimestre : $4, 6, 7, 12, 12, 17, 18, 18$.
  1. Calculer la moyenne $\bar{x}$ de cette série de notes.
  2. Déterminer la médiane $Me$, ainsi que les quartiles $Q_1$ et $Q_3$ de cette série.

Caractéristiques de dispersion

Étendue et intervalle interquartile

Définition
• L'**étendue** d'une série statistique est la différence entre la plus grande valeur et la plus petite valeur de cette série. • L'**écart interquartile** est la différence entre le troisième et le premier quartile : \[ \text{Écart interquartile} = Q_3 – Q_1 \] L'intervalle $[Q_1; Q_3]$ est appelé **intervalle interquartile**; il contient au moins 50\,\% des valeurs centrales de la série.

Variance et écart-type

Définition
Soit une série statistique de moyenne $\bar{x}$ dont les valeurs du caractère sont $x_1, x_2, \dots, x_k$ et les effectifs correspondants sont $n_1, n_2, \dots, n_k$.
  • La **variance**, notée $V$, est la moyenne des carrés des écarts à la moyenne : \[ V = \frac{n_1(x_1 – \bar{x})^2 + n_2(x_2 – \bar{x})^2 + \dots + n_k(x_k – \bar{x})^2}{N} = \frac{\sum_{i=1}^{k} n_i(x_1 – \bar{x})^2}{N} \]
  • L'**écart-type**, noté $\sigma$ (sigma), est égal à la racine carrée de la variance : \[ \sigma = \sqrt{V} \]
Remarque
L'écart-type est une caractéristique de dispersion indispensable : plus $\sigma$ est proche de 0, plus les valeurs de la série sont concentrées (homogènes) autour de la moyenne $\bar{x}$. Plus il est grand, plus la série est dispersée (hétérogène).
Application
On considère une série statistique de tailles d'élèves (en cm) résumée dans le tableau suivant : \[ \begin{array}{|c|c|c|c|c|} \hline \text{Taille } x_i & 150 & 160 & 170 & 180
\hline \text{Effectif } n_i & 2 & 5 & 8 & 5
\hline \end{array} \]
  1. Calculer l'effectif total $N$ et la taille moyenne $\bar{x}$ de ce groupe.
  2. Calculer la variance $V$ puis l'écart-type $\sigma$ à $10^{-2}$ près.