MDEM22G -cours 2 3 pages

icon

9

pages

icon

Français

icon

Documents

Écrit par

Publié par

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

9

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

24/09/2008Statistiques descriptives - Licence parcours démographie - Semestre 1Séance 2 : Dispersion (1)Lors de la dernière séance1. Paramètres de position centraleLa moyenneLa médianeLes fractiles (quantiles / déciles )Le mode2. Test de Khi 23. La boîte à pâtes (box plot): un mode de représentation graphique synthétiqueBreton Didier – MDEM22E Statistiques descriptives - Licence parcours démographie - Semestre 1Séance 2 : Dispersion (2)La séance s’appuie sur la réponse aux questions suivantes :Nom ? Code/libellé ? Type ? Nombre de modalités ?Breton Didier – MDEM22E Statistiques descriptives - Licence parcours démographie -Semestre 1Séance 2 : Dispersion (3)Le tableau des effectifsAge au moment de l'enquêteNombre de frères moins de 70 ans et 30-39 ans 40-49 ans 50-59 ans 60-69 anset sœurs 30 ans plusTotal0 40 29 40 49 21 47 471 151 143 118 121 68 77 772 165 161 155 128 51 65 653 80 84 107 96 61 54 544 50 60 89 72 46 32 325 35 42 64 64 25 25 256 19 31 37 32 30 23 237 14 24 25 34 19 21 218 9 17 26 24 16 10 109 3 11 23 13 12 5 510 et plus 8 14 30 35 17 15 8Total 574 616 714 668 366 374 3312Breton Didier – MDEM22E 124/09/2008Statistiques descriptives - Licence parcours démographie - Semestre 1Séance 2 : Dispersion (7)La BOX-PLOT : plus facile pour synthétiser l’information qu’une juxtaposition d’histogrammesRépartition du nombre d’enfants déclarés selon la région d’habitation à la date de l’enquête, France, 2003Valeurs ...
Voir icon arrow

Publié par

Langue

Français

Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (1)
Lors de la dernière séance
1.
Paramètres de position centrale La moyenne La médiane Les fractiles (quantiles / déciles ) Le mode
2. Test de Khi 2
3. La boîte à pâtes (box plot): graphique synthétique
un mode de représentation
B reton D idier – M D E M 22E
Statistiques descriptives - Licence parcours démographie - Semestre 1
Séance 2 : Dispersion (2)
La séance s’appuie sur la réponse aux questions suivantes :
B reton D idier – M D E M 22E
Statistiques descriptives - Licence parcours démographie -Semestre 1 Séance 2 : Dispersion (3) Le tableau des effectifs
N ombre de frères et sœ urs
0 1 2 3 4 5 6 7 8 9 10 et plus Total
moins de 30 ans
40 151 165 80 50 35 19 14 9 3 8 574
A ge au moment de l'enquête
30-39 ans
29 143 161 84 60 42 31 24 17 11 14 616
40-49 ans
40 118 155 107 89
64 37 25 26 23 30 714
50-59 ans
49 121 128 96 72
64 32 34 24 13 35 668
60-69 ans
21 68 51 61 46 25 30 19 16 12 17 366
70 ans et plus
47 77 65 54 32 25 23 21 10 5 15 374
Total 47 77 65 54 32 25 23 21 10 5 8
3312
B reton D idier – M D E M 22E
1
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (7) La BOX-PLOT : plus facile pour synthétiser l’information qu’une juxtaposition d’histogrammes
R épartition du nom bre d’enfants d
9
8
7
6
5
4
3
2
1
0 Moins de 30 ans
Valeurs extérieures : D1 et D9
On peut remplacer par les valeurs pivots suivantes a1 = Q1 – 1,5(Q3-Q1) a2 = Q3 + 1,5 (Q3-Q1)
30-39 40-49 50-59 60-69 âge des personnes au moment de l'enquête
70 et plus
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 :Dispersion (8)
Répartition du nombre d’enfants déclarés selon l’âge à l’enquête, France, 2003
9
8
7
6
5
4
3
2
1
2,
0 Moins de 30 ans
30-39
40-49
50-59
3,
60-69
âge des personnes au moment de l'enquête
70 et plus
Conclusions
1-Diminutionde la taille des fratries au fil des générations : diminution de la moyenne, de la médiane, du mode ….
2-Augmentationde la concentration de la taille des fratries (convergence des comportements…)
Mais QUELS INDICATEURS pour mesurer la dispersion ?
Statistiques descriptives - Licence parcours démographie - Semestre 1
Séance 2 : Dispersion (9)
Dans cette séance : 1. Les paramètres de dispersion
1.AL’étendue 1.BLes écarts interfractiles 1.CL’écart moyen absolu 1.DL’écart médian absolu 1.ELa variance 1.FL’écart-type, le coefficient de variation
2. Les paramètres de forme 2.ASymétrie d’une distribution 2.BAplatissement d’une distribution
3. Moyenne et variance de plusieurs sous-populations 3.AMoyenne 3.BVariance
B reton D idier – M D E M 22E
2
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (10)
1Les paramètres de dispersion
1.A.L'étendue
Synonyme:amplitude
Etendue = max(xi) – min (xi)
-Inconvénient: Ne dépend que des valeurs extrêmes, elle est rarement significative
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (11)
1.B.L'écart interfractile
C’est unparamètre de dispersion absolue - L'intervalle de Kelley(Ik)
Ik = D9 - D1
- comprend80 p.100 de l'effectif - permet d'éliminer les valeurs extrêmes
- L'intervalle interquartile (IIQ) IIQ=Q3 - Q1
-comprend50 p.100 de l'effectif - permet de ne travailler que sur le centre de la série
Séance 2 : Dispersion (12) Statistiques descriptives - Licence parcours démographie -Semestre 1
1.C.L'écart moyen absolu 11 m1i%1 e x x i11 nn
Si série non regroupée
i1
ci%x
Si série regroupée en « k » classes
Se lit dans l’unité de la variable étudiée
3
1.C.L'écart moyen absolu : application
N ombre de frères et sœ urs
0 1 2 3 4 5 6 7 8 9 10 et plus Total
C entre des classes 0 1 2 3 4 5 6 7 8 9 12,5
M oins de 30 ans
E ffectif (ni)
40 151 165 80 50 35 19 14 9 3 8 574
Moy
2,63
e m
60-69 ans
E ffectif (ni)
21 68 51 61 46 25 30 19 16 12 17 366
Moy
3,89
ni*|C i-moy|
81,7 196,5 96,4 54,3 5,1 27,8 63,3 59,1 65,8 61,3 146,4 857,5
e m
e1 m
« e »diminue m (passe de 2,3 à 1,6), l’écart moyen à la moyenne diminue : la concentration de la taille des fratries augmente
Séance 2 : Dispersion (14) Statistiques descriptives - Licence parcours démographie -Semestre 1
1.D.L'écart médian absolu
em1
1n x Q i11 i%21 n
Si série non regroupée
1 k nici%Q2 i11 n
Si série regroupée en « k » classes
Se lit dans l’unité de la variable étudiée
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (15)
1.E .La variance
1n i11 1x x² i% n
Si série non regroupée
1  k 1ni*ci%x²   i11  n
Formule développée 1n i11s²1Var(X)1(xi²!%x²] n
Si série regroupée en « k » classes
1k   i111ni*ci²%x²]     n
4
1.E.La variance : application Moins de 30 ans Form ule 1
Nombre de frères et sœurs 0 1 2 3 4 5 6 7 8 9 10 et plus Total
Centre des classes
0 1 2 3 4 5 6 7 8 9 12,5
E ffectif (ni)
M oy
40 151 165 80 50 35 19 14 9 3 8 574
2,63
Var(X )
4,7
Form ule 2
E ffectif (ni)
M oy
21 68 51 61 46 25 30 19 16 12 17 366
Var(x)
3,89
4,7
1 k 1 i1 n
1 i 1 n
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (17)
1.E .L’écart type
s1
Var(X)
S’exprime dans la même unité que la variable étudiée
Permet de déterminer l’ « intervalle remarquable » :
x%s;x#s oux%2s;x#2s
- Pour une loi normale, environ 95% des individus sont contenus dans le second intervalle.
- Plus l’écart type est important, plus la probabilité de tomber sur un échantillon avec une moyenne proche de la moyenne de la population totale est forte.
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (18)
1.E .Le coefficient de variation
Deux écarts-types ne sont comparables que si les moyennes associées aux séries respectives sont du même ordre.
Dans le cas contraire on compareles coefficients de variation:
CV1
s X
Une mesurerelativede la dispersion
²
5
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (19)
2.
Les paramètres de forme
2.A.La symétrie d’une distribution (1)
Par observation graphique (histogramme)
Etalée à droite
=
oblique à gauche
Symétrique
Etalée à gauche
=
oblique à droite
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (20) 2.A.La symétrie d’une distribution (2) Par observation graphique (box plot quelconque)
9
8
7
6
5
4
3
2
1
0
Étalée à droite
Symétrique
Étalée à gauche
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (21) 2.A.La symétrie d’une distribution (3) Le coefficient de Fisher 3 1 nj*(cj%x! n 3
SI
g1 >0
g1 =0
g1 <0
Oblique à gauche
Symétrique
Oblique à droite
6
Statistiques descriptives - Licence parcours démographie - Semestre 1² Séance 2 : Dispersion (22) 2.A.La symétrie d’une distribution (4) Le coefficient de Pearson x%Mode S1 k
Le coefficient de Yule et Kendall Q1 Yk1
SI
S ou Y >0 k k S ou Y =0 k k S ou Y <0 k k
Q3 2 *Q2 Q3%Q1 Oblique à gauche
Symétrique
Oblique à droite
Attention, ce sont des indicateurs à manier avec prudence, peuvent donner des résultats opposés
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (23)
2.B.L’aplatissement (1)
(histogramme)Par observation graphique
9 8 7 6 5 4 3 2 1 0
Aplatissement faible
Aplatissement moyen
Aplatissement élevé
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (24)
2.B.L’aplatissement (2)
Le coefficient d’aplatissement de Pearson 4 1 nj*(cj%x! n 4
Le coefficient d’aplatissement de Fisher (Kurtosis) m 4 g21 %3 4
Plus « b2 » ou « g2 » est élevé (b2 >0 et g2>3) plus la série est « effilée »
7
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (25)
2.B.L’aplatissement (1)
Par observation graphique (histogramme)
9 8 7 6 5 4 3 2 1 0
Aplatissement faible
b2 >b’2>b’’2
Aplatissement moyen
Aplatissement élevé
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (26) 3. Moyennes et variances de plusieurs populations
3.A.Moyenne xaxb Soit deux populations A et B, de moyennes respectives et
D’effectif respectifsnetneffectif de la population totale a b
Alors
*#* n xan xb a b p p 1 1*#* X x x a a b b n avec # 11 #p p nanb1n eta b
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (27)
3.B.Variance (1) Soit deux populations A et B, de moyennes respectives et xa naetnbe de varianceetD’effectif t a b
Alors
2 s
x b
2 2 2 2 *#* *x%X#*x%X a b nasanbsbnanb 1 # # # nanbnanb
Variance dans les groupes VAR « INTRA »
Variance entre les groupes VAR « INTER »
8
Statistiques descriptives - Licence parcours démographie - Semestre 1 Séance 2 : Dispersion (28)
3.B.Variance (2)
Et
Part expliquée par la variance dans les groupes. Si les populations de chaque sous-groupe sont assez homogènes, cette proportion est faible !
9
Voir icon more
Alternate Text