Caractéristiques de position d’une série statistique
Série statistique et effectifs
• Une **série statistique** est l'ensemble des données collectées lors de l'étude d'un caractère (qualitatif ou quantitatif) sur une population donnée.
• L'**effectif total**, noté $N$, est le nombre total d'individus de la population étudiée.
• L'**effectif** d'une valeur est le nombre de fois que cette valeur apparaît dans la série. La **fréquence** $f_i$ d'une valeur est le rapport de son effectif $n_i$ par l'effectif total $N$ :
\[ f_i = \frac{n_i}{N} \]
Moyenne d’une série statistique
La **moyenne** (notée $\bar{x}$) d'une série statistique dont les valeurs du caractère sont $x_1, x_2, \dots, x_k$ et les effectifs correspondants sont $n_1, n_2, \dots, n_k$ est égale à :
\[ \bar{x} = \frac{n_1 x_1 + n_2 x_2 + \dots + n_k x_k}{n_1 + n_2 + \dots + n_k} = \frac{\sum_{i=1}^{k} n_i x_i}{N} \]
[Linéarité de la moyenne]
Si une série de valeurs $x_i$ a pour moyenne $\bar{x}$, alors la série de valeurs $a x_i + b$ (où $a$ et $b$ sont deux réels) a pour moyenne :
\[ \overline{ax + b} = a\bar{x} + b \]
Une série de trois notes a une moyenne $\bar{x} = 3$.
Si l'on multiplie chaque note par $2$ et qu'on soustrait $5$, déterminer la nouvelle moyenne de la série en utilisant la propriété de linéarité.
Médiane et quartiles
On considère une série statistique dont les valeurs sont ordonnées dans le sens croissant :
- La **médiane**, notée $Me$, est un nombre réel qui partage la population en deux parties de même effectif. Au moins 50\,\% des individus ont une valeur inférieure ou égale à $Me$, et au moins 50\,\% ont une valeur supérieure ou égale à $Me$.
- Le **premier quartile**, noté $Q_1$, est la plus petite valeur de la série telle qu'au moins 25\,\% de l'effectif total soit inférieur ou égal à $Q_1$.
- Le **troisième quartile**, noté $Q_3$, est la plus petite valeur de la série telle qu'au moins 75\,\% de l'effectif total soit inférieur ou égal à $Q_3$.
Voici les notes obtenues par un élève au cours d'un trimestre : $4, 6, 7, 12, 12, 17, 18, 18$.
- Calculer la moyenne $\bar{x}$ de cette série de notes.
- Déterminer la médiane $Me$, ainsi que les quartiles $Q_1$ et $Q_3$ de cette série.
Caractéristiques de dispersion
Étendue et intervalle interquartile
• L'**étendue** d'une série statistique est la différence entre la plus grande valeur et la plus petite valeur de cette série.
• L'**écart interquartile** est la différence entre le troisième et le premier quartile :
\[ \text{Écart interquartile} = Q_3 – Q_1 \]
L'intervalle $[Q_1; Q_3]$ est appelé **intervalle interquartile**; il contient au moins 50\,\% des valeurs centrales de la série.
Variance et écart-type
Soit une série statistique de moyenne $\bar{x}$ dont les valeurs du caractère sont $x_1, x_2, \dots, x_k$ et les effectifs correspondants sont $n_1, n_2, \dots, n_k$.
- La **variance**, notée $V$, est la moyenne des carrés des écarts à la moyenne : \[ V = \frac{n_1(x_1 – \bar{x})^2 + n_2(x_2 – \bar{x})^2 + \dots + n_k(x_k – \bar{x})^2}{N} = \frac{\sum_{i=1}^{k} n_i(x_1 – \bar{x})^2}{N} \]
- L'**écart-type**, noté $\sigma$ (sigma), est égal à la racine carrée de la variance : \[ \sigma = \sqrt{V} \]
L'écart-type est une caractéristique de dispersion indispensable : plus $\sigma$ est proche de 0, plus les valeurs de la série sont concentrées (homogènes) autour de la moyenne $\bar{x}$. Plus il est grand, plus la série est dispersée (hétérogène).
On considère une série statistique de tailles d'élèves (en cm) résumée dans le tableau suivant :
\[
\begin{array}{|c|c|c|c|c|}
\hline
\text{Taille } x_i & 150 & 160 & 170 & 180
\hline \text{Effectif } n_i & 2 & 5 & 8 & 5
\hline \end{array} \]
\hline \text{Effectif } n_i & 2 & 5 & 8 & 5
\hline \end{array} \]
- Calculer l'effectif total $N$ et la taille moyenne $\bar{x}$ de ce groupe.
- Calculer la variance $V$ puis l'écart-type $\sigma$ à $10^{-2}$ près.