D - Inférence Statistique – Estimation et Tests d'hypothèses

icon

75

pages

icon

Français

icon

Documents

Écrit par

Publié par

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

75

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

D -
I
nférence Statistique –
Estimation et Tests d’hypothèses
1.
Introduction –
D
é
duction et inférence statistique
2.
Fluctuations d’échantillonnage
d’une proportion observée
3.
Principe et
résolut
i
on d’un test
d’hypothèse
4.
Fluctuation d’échantillonnage d’une moyenne observé
e
5.
Comparaison de 2 var
iances observées -
d
e 2 moyennes observées
6.
Tests du Khi-deux
7.
Autres tests non paramétriques
8.
Analyses de var
iance -
A
NOVA D
-
Inférence Statistique
-
-
Estimation et Tests d’hyp
o
o
thèses
1. Introduction –
D
éduction et inférence statistique
Population
:
ensemble total d objets ou d individus
Ø
tudier,
partir duquel sont extraits des Øchantillons.
La moyenne
µ
et l Øcart-type
σ
de la population
sont des
constantes
(gØnØralement inconnues),
exemples de
paramètres
fixes de la population ou
objectifs
.
!
Les probabilitØs
P(X)
sont utilisØes dans le calcul de
µ
et
σ D
-
Inférence Statistique
-
-
Estimation et Tests d’hyp
o
o
thèses
1. Introduction –
D
éduction et inférence statistique
Echantillon
:
Sous ensemble de la population.
Un
Øchantillon
représentatif
est un sous ensemble
choisi au hasard dans la population
.
La moyenne
X
et l Øcart-type
s
de l Øchantillon sont
des
variables aléatoires
,
variant
d un Øchantillon
l autre, et sont appelØes
statistiques d’échantillon
,
statistiques alØatoires ou
estimateurs
(ici respectivement de
µ
et
σ
)
Remarque
: la mØdiane m
peut Œtre dans certains ca
s un meilleur
estimateur
de ...
Voir icon arrow

Publié par

Nombre de lectures

209

Langue

Français

D -Inférence Statistique – Estimation et Tests d hypothèses
1.
2.
3.
4.
5.
6.
7.
8.
Introduction – Déduction et inférence statistique
’ ’ Fluctuations d échantillonnage d une proportion observée
Principe et résolution d un test d hypothèse ’ ’
Fluctuation d échantillonnage d une moyenne observée ’ ’
Comparaison de 2 variances observées - de 2 moyennes observées
Tests du Khi-deux
Autres tests non paramétriques
Analyses de variance - ANOVA
 ucllu eacd  eiséeutilns ls da sétili tnosLe.!abobprs 
P(X)
D -Inférence Statistiq ue - Estimation et Tests d h ypothèses 1. Introduction – Déduction et inférence statistique
sont des constantes (généralement inconnues),
Population : ensemble total dobjets ou dindividus à étudier, à partir duquel sont extraits des échantillons.
objectifs
exemples de paramètres fixes de la population o
µ et σ
La moyenne µ et lécart-type σ de la population
D - 
Inférence Statistiq ue - Estimation et Tests d h ypothèses 1. Introduction – Déduction et inférence statistique
Echantillon : Sous ensemble de la population. Un échantillon représentatif est un sous ensemble choisi au hasard dans la population .
La moyenne X et lécart-type s de léchantillon sont des variables aléatoires , variant dun échantillon à lautre, et sont appelées statistiques d échantillon , statistiques aléatoires ou estimateurs (ici respectivement de µ et σ ) Remarque : la médiane m e peut être dans certains cas un meilleur estimateur de µ que x Les fréquences relatives f/n sont utilisées dans le calcul de x et s
! [ Un estimateur T est dit biaisé si son espérance E(T) est différente de sa cible θ dans la population : biais = E(T)-θ ]
Tirage dun échantillon avec remise : important pour garantir l indépendance des n observations qui le constituent (surtout dans les petites populations ). La proportion comme la moyenne changeant sinon à chaque tirage!
Tirage dun échantillon sans remise : sans importance dans les grandes populations , aucune différence pratiquement que lon remette ou non chaque individu avant le tirage suivant. Pour lessentiel les observations sont indépendantes. Ce nest pas le cas pour une petite population
D Inférence Statistiq ue - Estimation et Tests d h ypothèses -1. Introduction – Déduction et inférence statistique
Déduction :
prédire, à partir d'une population connue ou supposée connue, les caractéristiques des échantillons qui en seront prélevés
Induction (inférence) :
prédire les caractéristiques d'une population inconnue à partir des statistiques déterminées dans un échantillon représentatif de cette population.
! Extrapolation des observations réalisées dans un échantillon à l'ensemble de la population
é,  ,ohiméténtiomégoc :rofnet(  stsrsea ,on Pde :tsu itelAutre te
IMPORTANCE DES SCHEMAS !
Exemples ; exercices
Test du ajustement à une loi)
Estimations : Intervalles de pari, Intervalles de confiance
Etude des fluctuations déchantillonnage dune moyenne observée,
(en se servant du modèle de cahier des charges vu lors de létude des fluctuations déchantillonnage dune proportion observée)
Intervalles de pari, Intervalles de confiance.
Etude des fluctuations déchantillonnage dune proportion observée,
Tests dhypothèses (conformité, homogénéité)
D -Inférence Statistiq ue - Estimation et Tests d h ypothèses 1. Introduction – Déduction et inférence statistique
χ 2
Allons y ...
D -Inférence Statis tiq ue - Estimatio n et Tests d h ypothèses 2. Fluctuations d échantillonnage d une proportion observée
Les proportions, indicateurs parmi d autres
Définition
Intérêt
On travaille sur un échantillon de taille quelconque pour obtenir des informations sur la population d origine
Caractéristique : Π [population]
Statistique : P o [observée ou observable sur un n-échantillon] P o comme estimateur de Π Tests et encadrements possibles : sur Π et P o On va travailler sur le biais : θ = Π - P o
Tests d thès D -Inférence Statis tiq ue - Estimatio n et h ypo es 2. Fluctuations d échantillonnage d une proportion observée
Comment traduire P(X=k) = 0.33 ?
! Si lon répétait un très grand nombre de fois lexpérience on obtiendrait X=k dans 33% des cas
! Autre façon de le formuler : 33% des échantillons conduisent à X=k (nbre infini de tirages)
En remplaçant X = k par P o = k/n :
! Fluctuations déchantillonnage dune proportion observée. ! Nature : Loi Binomiale de paramètres n et Π (objectif dans population) ! Problème continu lorsque n très grand.
de roba C -Lois p bilité s Fluctuation d échantillonage d une proportion expérimentale (observée)
p(X=
0.35
0.30
0.25 0.20 0.15 0.10 0.05 0.00
k)   Po
0
1
2
3
B  
4
5( ,.0
5
)5
k
Résultat de l échantillonnage ’ Expérience réalisée sur un grand nombre d échantillons)
k p(X=k)
0 0.031 1 0.156 2 0.313 3 0.313 4 0.156 5 0.031 moy. 2.500
Po
0.025 0.13 0.35 0.3 0.168 0.027 2.540
Loi théorique (atteinte lorsque le tirage concerne une nombre infini d échantillons)
suivage lonnntilibonol inu ena tlufahcéd snoitautc ed elamroN iol ne uar péechropptrt-pyeêmemé acenne et même moy   eedimlaneenm yo
Π et décart type σ=Π (1 −Π )  n
observée P o  de cet évènement dans des n -échanitillons, tirés au hasard de la population, subit des
 Lorsquun évènement donné E a une probabilité Π  dêtre observé dans une population, la proportion
’ ’ Fluctuations d échantillonnage d une proportion observée   !  Le caractère étudié est qualitatif  et sa répartition dans léchantillon ou la population constitue une variable aléatoire quantitative discrète.  
D -Inférence Statis tiq ue - Estimatio n et Tests d h ypothèses 2. Fluctuations d échantillonnage d une proportion observée
  
 En pratique (Ceci rend les calculs de probabilité aisés)  Si  N Π > 5  et N(1-Π ) > 5 Alors la loi binomiale est a             a     (    Π , Π (1 −Π ) )  n Nous serons amenés à vérifier cette condition à priori ou à posteriori ! ! Nous allons exploiter ces propriétés   
D -Inférence Statis tiq ue - Estimatio n et Tests d h ypothèses 2. Fluctuations d échantillonnage d une proportion observée
Tests de conformité DIFFERENCES ( P o-Π ) SIGNIFICATIVES ?
Π
Intervalles Hypothèse nulle Ho : de pari Π caractéristique connue (valeur donnée)
L échantillon observé peut-il provenir de cette population ? p o A quels type déchantillons issus de cette population peut-on sattendre? Risque seuil α ENCADREMENT DE P o  Risques α o et β Echantillon taille : n (n échantillon) _ représentatif P o : observée
Population taille ? Inaccessible Π : caractéristique connue ou supposée connue (résultant par ex détudes menées sur de nombreux échantillons)
Voir icon more
Alternate Text