Révisions
--
Séries statistiques à une et deux variables
icone Fiche
Tests
Les statistiques à une variable, étudiées en classe de première, permettent de chiffrer une situation, en calculant la moyenne, l'écart type, la médiane, les quartiles, etc. Elles permettent aussi de donner des représentations graphiques des données : diagrammes en bâtons, circulaires ou en boîtes, histogrammes, etc.
En considérant deux variables on peut observer s'il y a une corrélation entre elles : le volume des ventes d'un produit dépend de son prix, la température dépend de l'altitude, etc.
Lorsque l'une des variables est le temps, on dit que la série est chronologique. Une telle série permet, par exemple, d'estimer le chiffre d'affaires ou le bénéfice d'une entreprise à une date donnée future.
En considérant deux variables on peut observer s'il y a une corrélation entre elles : le volume des ventes d'un produit dépend de son prix, la température dépend de l'altitude, etc.
Lorsque l'une des variables est le temps, on dit que la série est chronologique. Une telle série permet, par exemple, d'estimer le chiffre d'affaires ou le bénéfice d'une entreprise à une date donnée future.
1. Comment calculer la moyenne et l'écart type ?
Du tableau statistique suivant :| Valeurs de la variable | x1 | … | xi | … | Total |
|---|---|---|---|---|---|
| Effectifs | n1 | … | ni | … | N |
On déduit :
- la moyenne :
, soit
; - la variance :
ou encore,
; - l'écart type :
.
La moyenne est représentative si :
- l'intervalle [
] contient plus des deux-tiers de l'effectif, - l'intervalle [
], plus de 95 %, - et l'intervalle [
], plus de 99 %.
2. Comment réaliser un diagramme en boîte ?
Un diagramme en boîte est un segment gradué dont les extrémités correspondent aux valeurs extrêmes de la série. On y reporte la médiane et les deux autres quartiles.La médiane est la valeur m de la variable qui partage la série en deux séries de même effectif :
- si l'effectif n est impair alors la médiane a le rang
; - si l'effectif est pair, la médiane est la moyenne des valeurs de rangs
et
.
La longueur Q1Q3 s'appelle l'intervalle interquartile.
On peut résumer la position de la médiane et des deux autres quartiles sur un diagramme en boîte, ou boîte à moustaches.
3. Comment calculer le point moyen d'un nuage de points ?
Du tableau statistique suivant :| Valeurs de la première variable | x1 | … | xi | … | xn |
|---|---|---|---|---|---|
| Valeurs de la seconde variable | y1 | … | yi | … | yn |
On déduit :
- par le dessin : le nuage de points M(xi ; yi) ;
- par le calcul : le point moyen

- avec
et
.
Exercice n°3
4. Comment déterminer la droite de régression linéaire ?
La droite de régression linéaire de y en x est la droite qui passe le plus près des points du nuage.Avec la calculatrice, on obtient son équation en entrant les valeurs de la première variable en liste 1 et les valeurs de la seconde en liste 2. On sélectionne alors la fonction « linreg ».
Trois éléments s'affichent : le coefficient directeur a, l'ordonnée à l'origine b et le coefficient de corrélation linéaire r.
Le coefficient r indique si les points M(xi ; yi) sont suffisamment proches de l'alignement pour assimiler le nuage de points à une droite.
On choisit généralement pour condition : −1
r < −0,9 ou 0,9 < r
1.Si la condition est vérifiée, on peut utiliser la fonction affine associée à la droite de régression linéaire pour estimer la valeur y correspondant à une valeur quelconque x.
Exercice n°4Exercice n°5Exercice n°6
À retenir
• Séries statistiques à une variable
Moyenne :
, soit
.
Variance :
ou encore,
.
Écart type :
.
La médiane est la valeur m de la variable, qui partage la série en deux séries de même effectif.
Le premier quartile Q1 se situe au quart de l'effectif et le troisième quartile Q3 aux trois-quarts. La longueur Q1Q3 s'appelle l'intervalle interquartiles.
Moyenne :
, soit
.Variance :
ou encore,
.Écart type :
.La médiane est la valeur m de la variable, qui partage la série en deux séries de même effectif.
Le premier quartile Q1 se situe au quart de l'effectif et le troisième quartile Q3 aux trois-quarts. La longueur Q1Q3 s'appelle l'intervalle interquartiles.
• Séries statistiques à deux variables
Point moyen du nuage : G
avec
et
.
La droite de régression linéaire est la droite qui passe le plus près des points du nuage. (La calculatrice donne son équation en entrant les valeurs de la première variable en liste 1 et les valeurs de la seconde en liste 2, puis en utilisant la fonction « linreg ».)
Le coefficient de corrélation linéaire, indiqué par la calculatrice, doit-être le plus proche possible de −1 ou 1 (valeurs qui correspondent à l'alignement parfait des points du nuage).
Point moyen du nuage : G
avec
et
.La droite de régression linéaire est la droite qui passe le plus près des points du nuage. (La calculatrice donne son équation en entrant les valeurs de la première variable en liste 1 et les valeurs de la seconde en liste 2, puis en utilisant la fonction « linreg ».)
Le coefficient de corrélation linéaire, indiqué par la calculatrice, doit-être le plus proche possible de −1 ou 1 (valeurs qui correspondent à l'alignement parfait des points du nuage).
