D - I nférence Statistique – Estimation et Tests d’hypothèses 1. Introduction – D é duction et inférence statistique 2. Fluctuations d’échantillonnage d’une proportion observée 3. Principe et résolut i on d’un test d’hypothèse 4. Fluctuation d’échantillonnage d’une moyenne observé e 5. Comparaison de 2 var iances observées - d e 2 moyennes observées 6. Tests du Khi-deux 7. Autres tests non paramétriques 8. Analyses de var iance - A NOVAD - Inférence Statistique - - Estimation et Tests d’hyp o o thèses 1. Introduction – D éduction et inférence statistique Population : ensemble total d objets ou d individus Ø tudier, partir duquel sont extraits des Øchantillons. La moyenne µ et l Øcart-type σ de la population sont des constantes (gØnØralement inconnues), exemples de paramètres fixes de la population ou objectifs . ! Les probabilitØs P(X) sont utilisØes dans le calcul de µ et σD - Inférence Statistique - - Estimation et Tests d’hyp o o thèses 1. Introduction – D éduction et inférence statistique Echantillon : Sous ensemble de la population. Un Øchantillon représentatif est un sous ensemble choisi au hasard dans la population . La moyenne X et l Øcart-type s de l Øchantillon sont des variables aléatoires , variant d un Øchantillon l autre, et sont appelØes statistiques d’échantillon , statistiques alØatoires ou estimateurs (ici respectivement de µ et σ ) Remarque : la mØdiane m peut Œtre dans certains ca s un meilleur estimateur de ...
D-InférenceStatistique’ Estimation et Tests d hypothèses
1.
2.
3.
4.
5.
6.
7.
8.
Introduction Déduction et inférence statistique
’ ’ Fluctuations d échantillonnage d une proportion observée
Principe et résolution d un test d hypothèse ’ ’
Fluctuation d échantillonnage d une moyenne observée ’ ’
Comparaison de 2 variances observées - de 2 moyennes observées
Tests du Khi-deux
Autres tests non paramétriques
Analyses de variance - ANOVA
ucllueacdeiséeutilnslsdasétilitnosLe.!abobprs
P(X)
D -Inférence Statistiq ue - Estimation et Tests d h ypothèses ’ 1. Introduction Déduction et inférence statistique
sont des constantes (généralement inconnues),
Population : ensemble total dobjets ou dindividus à étudier, à partir duquel sont extraits des échantillons.
objectifs
exemples de paramètres fixes de la population o
µ et σ
La moyenne µ et lécart-type σ de la population
D -
’ Inférence Statistiq ue - Estimation et Tests d h ypothèses 1. Introduction Déduction et inférence statistique
Echantillon : Sous ensemble de la population. Un échantillon représentatif est un sous ensemble choisi au hasard dans la population .
La moyenne X et lécart-type s de léchantillon sont des variables aléatoires , ’ variant dun échantillon à lautre, et sont appelées statistiques d échantillon , statistiques aléatoires ou estimateurs (ici respectivement de µ et σ ) Remarque : la médiane m e peut être dans certains cas un meilleur estimateur de µ que x Les fréquences relatives f/n sont utilisées dans le calcul de x et s
! [ Un estimateur T est dit biaisé si son espérance E(T) est différente de sa cible θ dans la population : biais = E(T)-θ ]
Tirage dun échantillon avec remise : important pour garantir l indépendance ’ des n observations qui le constituent (surtout dans les petites populations ). La proportion comme la moyenne changeant sinon à chaque tirage!
Tirage dun échantillon sans remise : sans importance dans les grandes populations , aucune différence pratiquement que lon remette ou non chaque individu avant le tirage suivant. Pour lessentiel les observations sont indépendantes. Ce nest pas le cas pour une petite population
D Inférence Statistiq ue - Estimation et Tests d h ypothèses -’ 1. Introduction Déduction et inférence statistique
Déduction :
prédire, à partir d'une population connue ou supposée connue, les caractéristiques des échantillons qui en seront prélevés
Induction (inférence) :
prédire les caractéristiques d'une population inconnue à partir des statistiques déterminées dans un échantillon représentatif de cette population.
! Extrapolation des observations réalisées dans un échantillon à l'ensemble de la population
Estimations : Intervalles de pari, Intervalles de confiance
•
Etude des fluctuations déchantillonnage dune moyenne observée,
•
(en se servant du modèle de cahier des charges vu lors de létude des fluctuations déchantillonnage dune proportion observée)
Intervalles de pari, Intervalles de confiance.
Etude des fluctuations déchantillonnage dune proportion observée,
Tests dhypothèses (conformité, homogénéité)
•
D -Inférence Statistiq ue - Estimation et Tests d h ypothèses ’ 1. Introduction Déduction et inférence statistique
χ 2
Allons y ...
’ D -Inférence Statis ’ tiq ue - Estimatio ’ n et Tests d h ypothèses 2. Fluctuations d échantillonnage d une proportion observée
Les proportions, indicateurs parmi d autres ’
Définition
Intérêt
Ontravaillesurunéchantillond’etaillequelconquepourobtenirdesinformations sur la population d origine
Caractéristique : Π [population]
Statistique : P o [observée ou observable sur un n-échantillon] P o comme estimateur de Π Tests et encadrements possibles : sur Π et P o On va travailler sur le biais : θ = Π - P o
’ Tests d thès D -Inférence Statis ’ tiq ue - Estimatio ’ n et h ypo es 2. Fluctuations d échantillonnage d une proportion observée
Comment traduire P(X=k) = 0.33 ?
! Si lon répétait un très grand nombre de fois lexpérience on obtiendrait X=k dans 33% des cas
! Autre façon de le formuler : 33% des échantillons conduisent à X=k (nbre infini de tirages)
En remplaçant X = k par P o = k/n :
! Fluctuations déchantillonnage dune proportion observée. ! Nature : Loi Binomiale de paramètres n et Π (objectif dans population) ! Problème continu lorsque n très grand.
de roba C -Lois p ’ bilité s ’ Fluctuation d échantillonage d une proportion expérimentale (observée)
p(X=
0.35
0.30
0.25 0.20 0.15 0.10 0.05 0.00
k)Po
0
1
2
3
B
4
5(,.0
5
)5
k
’ Résultat de l échantillonnage ’ Expérience réalisée sur un grand nombre d échantillons)
observée P o de cet évènement dans des n -échanitillons, tirés au hasard de la population, subit des
Lorsquun évènement donné E a une probabilité Π dêtre observé dans une population, la proportion
’ ’ Fluctuations d échantillonnage d une proportion observée ! Lecaractèreétudiéestqualitatifet sa répartition dans léchantillon ou la population constitue une variable aléatoire quantitative discrète.
’ D -Inférence Statis ’ tiq ue - Estimatio ’ n et Tests d h ypothèses 2. Fluctuations d échantillonnage d une proportion observée
En pratique (Cecirend les calculs de probabilité aisés) Si N Π > 5 et N(1-Π ) > 5 Alors la loi binomiale est a a ( Π , Π (1 −Π ) ) n Nous serons amenés à vérifier cette condition à priori ou à posteriori ! ! Nous allons exploiter ces propriétés
’ D -Inférence Statis ’ tiq ue - Estimatio ’ n et Tests d h ypothèses 2. Fluctuations d échantillonnage d une proportion observée
Tests de conformité DIFFERENCES ( P o-Π ) SIGNIFICATIVES ?
Π
Intervalles Hypothèse nulle Ho : de pari Π caractéristique connue (valeur donnée)
L échantillon observé peut-il provenir de cette population ? p o A quels type déchantillons issus de cette population peut-on sattendre? Risque seuil α ENCADREMENT DE P o Risques α o et β Echantillon taille : n (n échantillon) _ représentatif P o : observée
Population taille ? Inaccessible Π : caractéristique connue ou supposée connue (résultant par ex détudes menées sur de nombreux échantillons)