Cours, Chapitre de Mathématiques de niveau Première

icon

5

pages

icon

Français

icon

Documents

Écrit par

Publié par

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

5

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

Statistiques
Cours, Chapitre en Mathématiques (2011) pour Première S
Voir icon arrow

Langue

Français

1 sur 5
1S Chapitre 2: Statistiques
Dans ce chapitre, tous les exemples s'appuient sur la série de données suivante. Un site de comparaison des prix indique,pour un modèle de baladeur, les prix en euros: 129.51-129.85-129.85-129.85-129.98-130.5-131.08-133.9-135.99-135.99.
On peut résumer cette série statistique à l'aide d'un tableau d'effectifs:
Valeurxdu caractère : prix du i baladeur Effectifn i
I. Généralités
I.1 Moyenne
129.51 129.85 129.98 130.5 131.08 133.9 135.99 1 3 1 11 12
Définition I.1. La moyenne d'une série statistique, dont les valeursx,x, ...,xet les effectifs correspondantn,n, ...,n 1 2p1 2p est notéex‾ et vaut: p n x i i n x+n x+ ... +n x 1 12 2p p i= 1 x‾ == . n+n+ ... +n N 1 2p p Ndésigne l'effectif total:N=n1+n2+ ... +np=ni. i= 1
Remarque. sommedesproduitsn x i i On retiendra:x‾ = e ff ecti ftotal
Remarque. Lorsque les valeurs du caractère sont réparties en classe (intervalles), on calcule la moyenne en utilisant le centre de chaque classe.
Exemple. N= 1 + 3 + 1 + 1 + 1 + 1 + 2 = 10 1×129.51 + 3×129.85 + 1×129.98 + 1×130.5 + 1×131.08 + 1×133.9 + 2×135.99 x= 131.65 euros‾ = 10
Remarque. La moyenne est très sensible aux valeurs extrêmes.
I.2 Médiane
Définition I.2. Pour déterminer la médiane deNvaleurs, on range celles-ci parordre croissant. N+ 1 SiNest impair, la médianeM e.est la valeur du " milieu" , c'est à dire celle du caractère de rang 2 SiNest pair, la médianeM eest la demi-somme des 2 valeurs du " milieu" , c'est à dire celles du caractère N N de rangset +1 . 2 2
01/10/2011 11:28
2 sur 5
Exemple. 10 Les prix sont déjà rangés par ordre croissant.N= 10, donc l'effectif est pair.= 5. 2 Ainsi la médiane est la demi-somme des 5è et 6è prix: 129.98 et 130.5 129.98 + 130.5 M e130.24= = 2
I.3 Quartiles
Définition I.3.
Le premier quartile, notéQ, est le plus petit nombre de la série ordonnée tel que au moins 25% des 1 données soient inférieures ou égales à ce nombre. Le troisième quartile notéQest le plus petit nombre de la série tel que au moins 75% des données 3 soient inférieures ou égales à ce nombre. L'intervalle interquartile est l'intervalle[Q;Q] 1 3 L'écart interquartile est la différenceQQ.Il s'agit d'un paramètre de dispersion, car il mesure la 1 3 dispersion des 50% des valeurs qui entourent la médiane.
Exemple. 1 105 25 % de l'effectif total correspond àde l'effectif soit= =2.5. Le 3è prix est 129.85, donc 4 42 Q=x= 129.85 1 3 3 75% de l'effetif total correspond àde N soit 3×2.5 = 7.5.Le 8è prix est 133.90.DoncQ=x= 133.90. 3 8 4 L'intervalle interquartile est[129.85; 133.90]. L'écart interquartile est 133.90 − 129.85 = 4.05.
Remarque. La médiane et les quartiles sont des paramètres qui ne sont pas sensibles aux valeurs extrêmes de la série.
Remarque. L'écart interquartile permet d'étudier si les valeurs de la série sont concentrées autour de la médiane.
I.4 Etendue
Définition I.4. On appelle étendue d'une série statistique, la différence entre la plus grande valeur et la plus petite valeur de la série étudiée. e= étendue =xx max min
Exemple. e= 135.99 - 129.51 = 6.48
Remarque. Cet indicateur grossier ne tient compte que des valeurs extrêmes et non des valeurs intermédiaires.
01/10/2011 11:28
3 sur 5
II. Varianceet écart type
Définition II.1. La variance d'une série statistique dont les valeurs du cararctère sontx,x, ...,x, les effectifs 1 2p correpondantsn,n, ...,n, d'effectif totalNet de moyenne ‾xest 1 2p p 2 22 n(x− ‾x)+n(x− ‾x)+ ... +n x− ‾x 1 21 12 2p p V=i ix= n(x). N N i= 1
L'écart type σ de cette série est la racine carré de la variance σ =V Remarque. La variance est la moyenne des carrés des "écarts à la moyenne":x− ‾x i L'intérêt essentiel de l'écart type par rapport à la variance est son unité: c'est la même que celle du paramètre étudié. L'écart type permet d'avoir une idée de la façon dont les valeurs de la série s'écartent par rapport à la moyenne:un écart type faible correspond à une série concentrée autour de la moyenne. La variance et l'écart type sont des nombres positifs.
Exemple. p 1 21 22 2 V=nixi− ‾x)=((129.51 − 131.65)+ 3(129.85 − 131.65)+ 1×(129.98 − 131.65)+ 1×(130.5 ( N10 i= 1
σ =V6.1472.48 euros.
Remarque. En général, le calcul de la moyennex‾ ne tombe pas juste et l'erreur d'arrondi se propage tout le long du p 1 2 calcul deVpar la formuleV=nixix () N i= 1
La propriété ci-dessous est d'une très grande importance pratique, car la formule qu'elle donne permet d'utiliser qu'une seule fois le calcul de la moyenne, et fournit donc une valeur plus précise que la formule donnée par la définition.
Propriété II.1. p 1 22 V=nixi ( )− ‾x N i= 1
Démonstration. p 1 2 V=n(xx)par définition de la variance. i i N i= 1 p 1 2 22 22 x x(ab)=a− 2ab+b V=n x− 2xi‾ +en utilisant l'identité remarquable i i N i= 1 p 1 22 i ii ii i V=n x− 2n x x‾ +n x)en distribuantnsur chaque terme de la somme algébrique entre parenthèses N i= 1 n nn 1 22 22 2 V=n x− 2n x x‾ +n xn x− 2n xx+nx nx2n x N iii iicar faire la somme des termesi ii iirevient à faire la somme desi i, celle desi ix, i= 1i= 1i= 1 2 n celle desixet à sommer les 3 résultats obtenus.
01/10/2011 11:28
4 sur 5
n nn 1 21 12 1 iien distibuant − 2n x‾ +n xV=nxiN Ni xi N N i= 1i= 1i= 1 2‾xapparaît dans chaque produit de la foi x x2‾x rme2n i, on peut donc factoriser. 2 22 n xxDe même,xapparaît dans chaque produit de la formei, on peut donc factoriser. n n n 1 21 21 n x− 2xnn x On obtient ainsi:V=i ii i+ ‾xi N N N i= 1i= 1i= 1 n n 1 Dans la deuxième somme, on reconnaît la moyenne de la sériniif totaln=N =xe statistiquexiet dans la troisième somme l'effect i N i= 1i= 1 n n 1 22 1 22 DoncV=n x− 2‾x x‾ +x‾ =V=n xxi i i i N N i= 1i= 1
TRANSMATHS EXERCICE RESOLU C p 274
III. Résuméd'une série statistique
Si l'on souhaite retenir un seul nombre pour résumer une série statistique, un choisit un paramètre (ou indicateur) de position: la médiane ou la moyenne, appelée valeur centrale. Si l'onsouhaite aussi prendre en compte la répartition des valeurs autour de cette valeur "centrale", on lui associe un indicateur de dispersion: l'écart interquartile ou l'écart type. On obtient ainsi deux couples(M e,QQ)et(x, σ)qui sont deux résumés de la série statistique. 3 1 Ils ne prétendent opas restituer toute l'information de la série statistique, mais ils permettent de synthétiser l'essentiel et de faciliter la comparaison de plusieurs séries.
A. Lecouple (moyenne, écart type) soit(x‾, σ)a l'inconvénient d'associer deux paramètres sensibles aux valeurs extrêmes. Ce couple joue un grad rôle en statistique théorique (par exemple appliqué aux sondages). Comme l'écart type tient compte de tous les écarts à la moyenne, il donne beaucoup de poids aux valeurs extrêmes.Son choix n'est donc pertinent que lorsque le diagramme qui représente la série est assez symétrique et évoque la forme d'une "courbe en cloche". B. Lecouple (médiane, écart interquartile) soit(x‾, σ)n'a pas ce défaut, mais sa détermination est moins pratique.
IV. Digrammesen boîte
Les valeurs extrêmes (xetx), la médianeM eet les quartilesQetQpermettent de partager une série entre min max1 3 4 parties contenant chacune environ un quart de l'effectif total.(On a ainsi une répartition des valeurs d'une série.) Le diagrammes en boîte est un diagramme regroupant ces différentes valeurs.On parle aussi de "boîtes à moustaches", de diagramme de TUKEY, statisticien américain ou "boîtes à pattes" ou encore "box-plot".
Construit au-dessus d'un axe gradué, il est constitué:
d'une boîte délimitée par les 1ier et 3è quartiles et partagée par la médiane.Sa hauteur est souvent arbitraire (elle peut dépendre de de l'effectif). de deux traits qui relient les quartiles aux valeurs extrêmes de la série.
01/10/2011 11:28
5 sur 5
M inQ_3 MaxQ_1 Me
Remarque. Une boîte et des "pattes" courtes indiquent que la série est assez concentrée autour de sa médiane. Un des avantages de cette représentation est qu'elle nécessite très peu de calculs. La superposition de diagrammes en boîte se révèle particulièreemnt pertinente pour comparer plusieurs séries étudiant le même caractère mais sur des pomulations différentes. Exercice 1. réaliser sur papier pmillimétr le digramme en boîte correspondant aux prix des lecteurs MP3. On pourra prendre pour unité sur l'axe gradué 1 cm pour 1 euro.
TRANSMATH EXERCICES RESOLUS A et B p 271
01/10/2011 11:28
Voir icon more
Alternate Text