Cours sur les statistiques

icon

13

pages

icon

Français

icon

Documents

Écrit par

Publié par

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

13

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

STATISTIQUESI) Médiane et quartiles d'une série statistique quantitativea) Cas d'une série statistique discrèteDans ce cas, on dispose d'une famille de réels x ; x ; ... ; x que l'on a rangé dans l'ordre croissant :1 2 Nx  x  ...  x (Certains de ces réels peuvent être confondus)1 2 N Vocabulaire : x s'appelle le terme de rang 1 (ou d'indice 1), x le terme de rang (ou d'indice) i (1  i  N)1 iN représente l'effectif total.On note (x ) cette famille de réels qu'on appelle encore "série statistique".i 1 i NExemples :L'élève A a obtenu les 8 notes suivantes :x = 5 x = 5 x = 6 x = 9 x = 10 x = 12 x = 13 x = 131 2 3 4 5 6 7 8L'élève B a obtenu les 9 notes suivantes :x = 2 x = 3 x = 5 x = 6 x = 8 x = 9 x = 9 x = 10 x = 101 2 3 4 5 6 7 8 9L'élève C a obtenu les 10 notes suivantes :x = 6 x = 6 x = 10 x = 12 x = 12 x = 13 x = 14 x = 15 x = 16 x = 161 2 3 4 5 6 7 8 9 10L'élève D a obtenu les 11 notes suivantes :x = 0 x = 0 x = 1 x = 4 x = 5 x = 8 x = 10 x = 12 x = 13 x = 16 x = 171 2 3 4 5 6 7 8 9 10 11Définition 1 MédianeOn appelle médiane tout réel m tel que :eau moins 50% des termes de la série ont une valeur inférieure ou égale à meetau moins 50% des termes de la série ont une valeur supérieure ou égale à meOn prouvera, ci-dessous (théorème 1), qu'un tel réel existe toujours !Remarque : la médiane partage l'ensemble des termes en deux sous ensembles de même effectif. (Enfin presque !)Exemples :Pour l'élève A (N = 8) : m = x = 9 (x = 10 ...
Voir icon arrow

Publié par

Langue

Français

STATISTIQUES
I) Médiane et quartiles d'une série statistique quantitative
a) Cas d'une série statistique discrète
Dans ce cas, on dispose d'une famille de réels x ; x ; ... ; x que l'on a rangé dans l'ordre croissant :1 2 N
x  x  ...  x (Certains de ces réels peuvent être confondus)1 2 N
Vocabulaire : x s'appelle le terme de rang 1 (ou d'indice 1), x le terme de rang (ou d'indice) i (1  i  N)1 i
N représente l'effectif total.
On note (x ) cette famille de réels qu'on appelle encore "série statistique".i 1 i N
Exemples :
L'élève A a obtenu les 8 notes suivantes :
x = 5 x = 5 x = 6 x = 9 x = 10 x = 12 x = 13 x = 131 2 3 4 5 6 7 8
L'élève B a obtenu les 9 notes suivantes :
x = 2 x = 3 x = 5 x = 6 x = 8 x = 9 x = 9 x = 10 x = 101 2 3 4 5 6 7 8 9
L'élève C a obtenu les 10 notes suivantes :
x = 6 x = 6 x = 10 x = 12 x = 12 x = 13 x = 14 x = 15 x = 16 x = 161 2 3 4 5 6 7 8 9 10
L'élève D a obtenu les 11 notes suivantes :
x = 0 x = 0 x = 1 x = 4 x = 5 x = 8 x = 10 x = 12 x = 13 x = 16 x = 171 2 3 4 5 6 7 8 9 10 11
Définition 1 Médiane
On appelle médiane tout réel m tel que :e
au moins 50% des termes de la série ont une valeur inférieure ou égale à me
et
au moins 50% des termes de la série ont une valeur supérieure ou égale à me
On prouvera, ci-dessous (théorème 1), qu'un tel réel existe toujours !
Remarque : la médiane partage l'ensemble des termes en deux sous ensembles de même effectif. (Enfin presque !)
Exemples :
Pour l'élève A (N = 8) : m = x = 9 (x = 10 conviendrait également ou, plus généralement, tout réel de [9 ; 10])e 4 5
Pour l'élève B (N = 9) : m = x = 8 (et là, il n'y a pas d'autre choix possible)e 5
Pour l'élève C (N = 10) : m = 12,5 (ou tout réel de l'intervalle [x ; x ] = [12 ; 13])e 5 6
Pour l'élève D (N = 11) : m = 8 (et là, il n'y a pas d'autre choix possible)e
On constate que la détermination de la médiane est différente suivant que l'effectif total N est pair ou impair :
• Lorsque l'effectif total N est impair, il n'y a pas de difficulté, la médiane m est le terme central, à savoir lee
N + 1
terme de rang . On a donc : m = x .e N +12
2
Statistiques Page 1 G. COSTANTINI http://bacamaths.net/• Lorsque l'effectif total N est pair, l'usage veut que l'on choisisse pour médiane m la moyenne des deuxe
x + xN N +1N N 2 2termes centraux, à savoir : les termes de rang et + 1. On a donc : m = .e
2 2 2
Mais tout réel de l'intervalle [x ;x ] conviendrait également. (En effet, dans certaines situations, laN N
+1
2 2
moyenne des deux termes centraux, qui n'est pas une valeur de la série, n'a pas de sens : par exemple, quel
est le jour médian du mois de juin ? Le mois de juin comporte 30 jours. Les deux termes centraux sont 15 et
ème ème ème16 (15 jour et 16 jour). Dire que "le jour médian est le 15,5 " n'a pas de sens. Mieux vaut dire (dans
ème èmece type de situation) : "le jour médian est le 15 jour" ou "le jour médian est le 16 jour" (au choix !) ...)
x x+21 22Exemple : si N = 29 alors m = x ; si N = 42 alors m = .e 15 e
2
Exercice : quelle est la médiane de la série suivante : x = 1 x = 1 x = 1 x = 1 x = 1 ?1 2 3 4 5
Définition 2 Quartiles
On appelle premier quartile tout réel Q tel que :1
au moins 25% des termes de la série ont une valeur inférieure ou égale à Q1
et
au moins 75% des termes de la série ont une valeur supérieure ou égale à Q1
On appelle troisième quartile tout réel Q tel que :3
au moins 75% des termes de la série ont une valeur inférieure ou égale à Q3
et
au moins 25% des termes de la série ont une valeur supérieure ou égale à Q3
On prouvera, ci-dessous (théorème 1), que de tels réels existent toujours !
Remarques :
• Le deuxième quartile Q ne se défini pas puisqu'il s'agit de la médiane m .2 e
• Les trois quartiles partagent l'ensemble des valeurs en quatre sous ensembles de (presque) même effectif.
• On a toujours : Q  m  Q .1 e 3
Exemples :
Pour l'élève A, on peut choisir : Q dans [x ; x ] = [5 ; 6] et Q dans [x ; x ] = [12 ; 13]1 2 3 3 6 7
Pour l'élève B, on a : Q = x = 5 et Q = x = 9 (pas d'autres choix possibles)1 3 3 7
Pour l'élève C, on a : Q = x = 10 et Q = x = 15 (pas d'autres choix possible)1 3 3 8
Pour l'élève D, on peut choisir : Q = x = 1 et Q = x = 13 (pas d'autre choix possible)1 3 3 9
Statistiques Page 2 G. COSTANTINI http://bacamaths.net/On constate que la détermination des quartiles est différente suivant que l'effectif total N est un multiple de 4
ou non :
• Lorsque l'effectif total N n'est pas un multiple de 4, il n'y a pas de difficulté, les quartiles Q et Q sont les1 3
N 3N
termes de rang immédiatement supérieur à et :
4 4
Q = x Q = x1 3N 3NØ ø Ø ø+1 +1Œ Œœ œ4 4º ß º ß
• Lorsque l'effectif total est un multiple de 4, alors l'usage veut que l'on choisisse pour quartiles Q et Q les1 3
N 3N
termes de rang et de rang . On a donc Q = x et Q = x . Mais tout réel de l'intervalle1 3N 3N4 4
4 4
[ x ; x ] conviendrait également pour Q et tout réel de l'intervalle [x ;x ] conviendrait1N N 3N 3N+1 +1
4 4 4 4
également pour Q .3
Exemple : si N = 29 alors Q = x et Q = x ; si N = 44 alors Q = x et Q = x .1 8 3 22 1 11 3 33
Voici un théorème qui donne des formules qui marchent dans tous les cas !
Théorème 1
*Soient N ˛  et (x ) une famille de réels ordonnés dans l'ordre croissant. Les réels :i 1 i N
Q = x m = x Q = x1 e 3N N 3NØ ø Ø ø Ø ø+1 +1+1Œ œ Œ œ Œ œ4 2 4º ß º ß º ß
définissent toujours des valeurs convenables pour le premier quartile, la médiane et le troisième quartile.
Pour démontrer ce théorème, on aura besoin du petit lemme suivant :
Lemme
Soient A et B des éléments de avec A B. L'ensemble A ; B contient B - A + 1 entiers.
Preuve du lemme :
L'ensemble A ; B contient autant d'entiers que l'ensemble A - A + 1 ; B - A + 1 =  1 ; B - A + 1 qui lui
même en contient B - A + 1.
Démonstration du théorème 1 :
Pour tout réel l, notons E(l) = {i ˛  1 ; N tels que x l} et F(l) = {i ˛  1 ; N tels que x l}i i
E(l) est l'ensemble des indices des termes de la famille (x ) qui sont inférieurs à l et F(l) est l'ensemblei 1 i N
des indices des termes de la famille (x ) qui sont supérieurs à l.i 1 i N
Posons : Q = x m = x Q = x1 e 3N N 3NØ ø Ø ø Ø ø+1 +1+1Œ œ Œ œ Œ œº 4 ß º 2 ß º 4 ß
Montrons que m est une valeur convenable pour la médiane : soit i ˛  1 ; Ne
Statistiques Page 3 G. COSTANTINI http://bacamaths.net/
 
 
  Ø N Ø Nø øx m Û x  x Û 1  i  + 1 Û i ˛  1 ; + 1i e i NØ ø Œ œ Œ œ2 2+1 º ß º ߌ œ2º ß
Ø N ø Ø N ø
Or, dans 1 ; + 1 il y a + 1 entiers.Œ œ Œ œ2 2º ß º ß
NØ ø
Donc Card(E(m )) = + 1e Œ œ2º ß
Ø N N Ø N Nø øOr,   + 1, donc : Card(E(m ))  eŒ œ Œ œ2 2 2 2º ß º ß
De même :
Ø N Ø Nø øx  m Û x  x Û N  i  + 1 Û i ˛  + 1 ; Ni e i NØ ø Œ œ Œ œ2 2+1 º ß º ߌ œ2º ß
Ø N ø Ø N ø
Or, dans + 1 ; N il y a N - entiers.Œ œ Œ œ2 2º ß º ß
NØ ø
Donc Card(F(m )) = N - e Œ œ2º ß
Ø N ø N Ø N ø Ø N ø N Ø N ø N N
Or,   + 1 donc - - et en ajoutant N : N -  donc Card(F(e ))  .mŒ œ Œ œ Œ œ Œ œ2 2 2 2 2 2 2 2º ß º ß º ß º ß
On a donc bien :
au moins 50% des termes de la série ont une valeur inférieure ou égale à me
et
au moins 50% des termes de la série ont une valeur supérieure ou égale à me
Donc m est bien une valeur médiane de la série.e
Montrons que Q est une valeur convenable pour le premier quartile : soit i ˛  1 ; N1
N NØ ø Ø ø
x  Q Û x  x Û i  + 1 Û i ˛  1 ; + 1i 1 i Ø N ø Œ œ Œ œ+1 4 4º ß º ߌ œ4º ß
N NØ ø Ø ø
Or, dans 1 ; + 1 il y a + 1 entiers.Œ œ Œ œ4 4º ß º ß
NØ øDonc Card(E(Q )) = + 11 Œ œ4º ß
N N N NØ ø Ø ø
Or,   + 1, donc : Card(E(Q ))  1Œ œ Œ œ4 4 4 4º ß º ß
De même :
N N&#

Voir icon more
Alternate Text