Initiation ` a l'Estimation Statistique et Applications ...

icon

11

pages

icon

Catalan

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

11

pages

icon

Catalan

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

Initiation a` l’Estimation Statistique
et Applications Astrom´etriques
Fr´ed´eric Arenou
UMR 8111 du CNRS et G´epi (Observatoire de Paris)
Support de cours au
TD bruit et signaux
Revision: 1.1.1 , Date: 2004/10/15 13:53:31
Mise a` jour sur http://wwwhip.obspm.fr/˜arenou
1 L’estimation statistique - biais: en plus des erreurs al´eatoires sur les donn´ees obser-
vationnelles,onpeutparfoiss’attendre`adeserreurssyst´ema-
` tiques.1.1 A quoi servent les statistiques?
Parmi les diff´erentes causes de ces biais: probl`emes instru-
Le probl`eme de l’estimation statistique est aussi ancien que mentaux (par exemple d´eformation de plaques photographi-
les diff´erentes sciences observationnelles, d`es lors qu’il a fallu ques), ´echantillon non repr´esentatif, et en particulier a` cause
synth´etiserdesmesuresr´ep´et´eesd’unemˆemegrandeurincon- d’une censure (ex: on observe des´etoiles jusqu’`a une certaine
nue. Les diff´erentes applications de l’estimation sont les sui- magnitude apparente limite, donc on privil´egie les plus in-
vantes: trins`equementbrillantes,donclamagnitudeabsoluemoyenne
-inf´ererlespropri´et´esd’unepopulationa`partird’un´echan- observ´ee est biais´ee), pr´esence de points aberrants (si l’esti-
tillon repr´esentatif: onsupposequel’´echantillonquel’onaest mateur que l’on utilise y est sensible)
extrait d’une population parente dont on connaˆıt la forme de
la distribution, et dont on cherche la meilleure valeur des pa-
ram`etres qui la caract´erisent (estimation ...
Voir icon arrow

Publié par

Langue

Catalan

Initiation`alEstimationStatistique etApplicationsAstrome´triques
Fre´d´ericArenou UMR8111duCNRSetGe´pi(ObservatoiredeParis)
Support de cours au TD bruit et signaux Revision: 1.1.1 , Date: 2004/10/15 13:53:31 Misea`joursurhttp://wwwhip.obspm.fr/˜arenou
1L’estimation statistique ` 1.1 A quoi servent les statistiques ? Leprobl`emedelestimationstatistiqueestaussiancienque lesdie´rentessciencesobservationnelles,de`slorsquilafallu synth´etiserdesmesuresre´p´et´eesdunemˆemegrandeurincon-nue.Lesdi´erentesapplicationsdelestimationsontlessui-vantes : -inf´ererlesproprie´te´sdunepopulationa`partirdune´chan-tillonrepr´esentatif:quse´elhaecilntqnolleueanotsosnpuop extraitdunepopulationparentedontonconnaıˆtlaformede la distribution, et dont on cherche la meilleure valeur des pa-rame`tresquilacaract´erisent(estimationponctuelle) ou un intervalledeconancequicontiennecesparame`tresavecune certaineprobabilit´e(estimationd’intervalle). Extraire un si-gnal du bruit de mesure en est une application analogue. -choisirentredi´erenteshypothe`ses:par exemple savoir si laloideserreurssurdesdonn´eesestounongaussienne,ou bieneˆtrecertainquuneobservationquelonvientdobtenir est(signicativement)die´rentedecellequunmod`elepr´edi-rait.
1.2 Quelques remarques -inf´erence:le but de l’estimation statistique est d’analy-serlese´ve`nementspass´es,et´eventuellementdepre´direles e´v`enementsfuturs.Lemotpr´edirenestpasinnocent,car   ilsous-entendlerisquedesetromper:meˆmesilesme´thodes utilise´esproviennentdesmath´ematiques,ou`cestlad´eduction quiestutilise´e,lestimationstatistiqueutiliselnce´ereifn, tout commelaphysique.Cestdoncuneinterpre´tationdumonde (unemode´lisationr´eductrice),lebutestquecensoitlaplus probable... - grandeurs physiques:otturuerailbveraerv´eobsneereeau demesureale´atoire(dontondoitdoncindiquerladispersion). Ex:silonmesuredesparallaxestrigonom´etriques,ondoit logiquementsattendre`aobtenirdesparallaxesne´gatives, mˆemesilonsaitquelavraieparallaxeestpositive.Toute analysededonne´esdoitdoncprendreleserreursdemesure en compte. -´echantillon:ituqdee´ep-neaunlynastseisatselse´ratludst dentclairementdelatailledel´echantillonetdesarepre´senta-tivit´e;lessondagesdopinionensontunexemple. -interpre´tation:uenustltadsitate´rpe´rsednosdorlerntiel analyse,ilnefautpasconfondrecorre´lationetcausalit´e.
1
- biais:atoial´eeursserrsuednelp-erbssoee´nnodselrusser vationnelles,onpeutparfoissattendre`adeserreurssyst´ema-tiques. Parmilesdi´erentescausesdecesbiais:probl`emesinstru-mentaux(parexemplede´formationdeplaquesphotographi-ques),´echantillonnonrepr´esentatif,etenparticulier`acause dunecensure(ex:onobservedes´etoilesjusqua`unecertaine magnitudeapparentelimite,donconprivile´gielesplusin-trins`equementbrillantes,donclamagnitudeabsoluemoyenne observe´eestbiaise´e),pr´esencedepointsaberrants(silesti-mateur que l’on utilise y est sensible)
2
Probabilite´s
2.1 Conventions Unevariableal´eatoire(v.a.)estunefonctiona`valeurre´elle (ouunvecteurdontlescomposantessont`avaleursre´elles). Pour une v.a.Xaeilasitnoetsar´x, on notera souventf(x) au lieu defX(xbalirpboe´edsntidesa).it´e Onsint´eresseraessentiellement`adesfonctionscontinues. Danslecasdiscreto`uΩ=(x1, . . . , xn) est l’ensemble des valeurs possibles de la v.a.X, et en notantpi=P(X=xi) laprobabilite´dere´alisation,ilsutdesubstituerlessomma-tionsauxint´egralesetpi`af(x). Onutiliseraleslettresgrecquespourlesparam`etresincon-nus, les autres lettres pour les estimations empiriques :mb µ,sσ;θsenuamitse´dengivaleurinteurdelaocnneu θ, le signeindique qu’une v.a. suit une certaine loi de probabilit´e.Onnotesouventxou< x >la valeur moyenne. Pour qu’il n’y ait pas de confusion, on note dans ce qui suit $lallarapae´undxeetleoietπle nombre utile aux sages.
2.2
Fonctionder´epartition(distribution)
FX(x) =P(Xx), -Proprie´te´s:
F(x)[0,1],
x[−∞,+]
F(−∞) = 0,
0 F(x)F(x),
F(+) = 1
0 xx
Initiationa`lEstimationStatistiqueetApplicationsAstrome´triques
2.3
Densite´deprobabilit´e(p.d.f.)
dF f(x) = dx Pour qu’une fonctionfsoienutsnede´tifli,tdaucaonoiumns quef(x)nt´etdi0e1e.rgla -densite´marginaleenXd’une loif(x, y): Z +fX(x) =f(x, y)dy −∞ Z a P(Xa) =fX(x)dx −∞
3
-ind´ependance:
XetYe´dsnedtnneapsitno⇐⇒
f(x, y) =fX(x)fY(y),
(x, y)
-densite´conditionnelle: f(x, y) f(x|y) = fY(y) Z b P(aXb|Y=y) =f(x|y)dx a
3.1
Moments
Espe´rancemath´ematique
Z +E[X] =xf(x)dx=µ −∞ Z +E[g(X)] =g(x)f(x)dx −∞ Quandgcnodtasafliarduean´e,irtinclionenofapusetsn-tendreeng´en´erala`cequeE[g(X)]6=g(E[X,)uof,romul´e] autrement, siE[X] =µ, ceci signifie queg(Xpe)ˆeutnrtue estimateurbiais´edeg(µ).
3.1.1 Application Soit$0emaxllrapaneuesur´eeaveclapr´cesioinσ, estimateur suppose´nonbiais´edelaparallaxe$unedile.´etonoiSl 1 chercheladistancedele´toile(ril paraˆıt naturel d’uti-= ), $ 1 liser.Ve´rionssicetestimateurdelavraiedistancerest $0 ounonbiaise´,danslecaso`uleserreurssontgaussiennes: Z +2 1 1 1 1 1 ($$) 0 2 E[ ]=e d$02σ $0$ σ2π−∞$0$ Z +2 1 1 u 2 =(1)e du(1) σ $2π−∞1 +u $ σ 6euqse`dg´en=0l,ra´een6= 0 $ Ladistancecalcul´eeaveclaparallaxeobserve´eestdoncbiaise´e, 2 4 σ σ σ avec un biais3+ 35+. . ..aux premiers ordres en $ $ $ Cebiaisestaggrave´quandonneconservequelesparallaxes positives. Lad´emonstrationestanaloguepourlecalculdelamagni-tude absolue en utilisant la loi de Pogson.
Revision: 1.1.1
3.2 Variance   2 2 σ(X) =E(XE[X]) R +2 = (xµ)f(x)dx −∞
= =
2
2 2 E[X]E[X] R +2 2 x f(x)dxµ −∞
´ 3.3 Ecart-typeσ(X) Cestlaracinecarre´edelavariance.Pourlad´esigner,on rencontrerasouventlestermesderreur,depre´cision,dedis-persion. L’erreur interne (ou formelle) est celle qui est obtenue parlam´ethodedestimationutilise´e,paropposition`alerreur externe.
3.4
Covariance
Cov(X, Y) =E[(XE[X])(YE[Y])] Z += (xµX)(yµY)f(x, y)dxdy −∞ Z +=xyf(x, y)dxdyµXµY −∞ On a Cov(X, Y) = Cov(Y, X) et, siaetbedrse´les,ostn
Cov(aX+bY, Z) =aCov(X, Z) +bCov(Y, Z)
Dans le cas multidimensionnel d’un vecteurX= (Xi), on introduit la matrice de variance-covariance h i T V=E(XE[X])(XE[X(Cov(]) = Xi, Xj))
dontladiagonaleestform´eedesvariances,etquiestd´enie non-n´egative.
3.5
Corr´elation
Cov(X, Y) ρ(X, Y) = σ(X)σ(Y) Dans le cas multidimensionnel, soitX= (Xiarec´,d)epyt-t XiE[Xi] (σi), et soient Δi=reoe.amseieln´ssno´naeLlds σi   T matriceR=EΔΔlamaestteden,ioermcedecirttale´rro g´ene´ral(ρ(Xi, Xjt´egalementd´en))e,onei´n-ntage.evi On a toujours1ρ(X, Y)1, et d’autre partρ(X, Y) = 0silesdeuxvariablesnesontpascorre´le´es.Noterquelinde´-pendanceimpliquelanon-corre´lation,maisquelinversenest pasforc´ementvrai(saufdanslecasGaussien).SiXetYsont compl`etementcorr´el´ees,|ρ(X, Y)|= 1, c’est qu’il existe des r´eelsa, b, ctels queaX+bY=c. SiX, Ysont des v.a. eta, bs,on´eeldesra
2 2 2 2 Var(aX+bY) =a σ(X) + 2abρ(X, Y)σ(X)σ(Y) +b σ(Y)
3.5.1 Application Lesdonne´esdHipparcosfurentre´duitespardeuxConsor-tiums,avecdesre´sultatsdonccorr´ele´s.Commentde´terminer lesvariationsducoecientdecorr´elationdesparallaxes? On ne peut pas utiliser l’estimateur empirique P n ($Fi$F)($Ni$N) i=1 R=pP P n n 2 2 ($Fi$F) ($Ni$N) i=1i=1
Voir icon more
Alternate Text