´ ´universitepierreetmariecurie annee universitaire 2010/2011 ´Master 1 Mathematiques MM013 Statistique Math´ematique Lucien Birg´e – 20112 L. Birg´eChapitre I Introduction aux probl`emes statistiques 1 Notion d’exp´erience statistique 1.1 Statistique Descriptive et Statistique Math´ematique Lorsque l’on dispose de donn´ees, c’est a` dire d’un certain nombre de mesures (qua- litative ou quantitatives, r´eelles ou vectorielles) x ,...,x `a valeurs dans E (un espace1 n kfini, ou une partie deR, ou deR ), le probl`eme se pose de les analyser et d’essayer d’en tirer des conclusions. La Statistique Descriptive s’efforce de trouver des repr´esentations simplifi´ees de ces donn´ees en ´etudiant certaines de leurs caract´eristiques, comme leur moyenne, etc, bref de trouver des r´esum´es parlants de ce gros ensemble de chiffres. Les techniques ad´equates rel`event de l’Analyse des donn´ees ou plus g´en´eralement de ce que l’on appelle en anglais Data Analysis. Le r´esultat est une´etude descriptive ou qualitative du genre “on voit que ...” ou “on constate que ...”, mais pas de type d´ecisionnel. Pourprendredesd´ecisionsousimplementvaliderlesconclusionsd’uneanalysedescrip- tive de donn´ees, on a recours `a une autre approche, celle de la Statistique Math´ematique, laquelle consid`ere que les donn´ees x ∈ E sont des r´ealisations (pas n´ecessairementi ind´ependantes et identiquement distribu´ees, en abr´eg´e i.i.d.) d’un m´ecanisme al´eatoire. La statistique math´ematique postule ...
Lorsquel’ondisposededonne´es,c’est`adired’uncertainnombredemesures(qua-litativeouquantitatives,re´ellesouvectorielles)x1, . . . , xn`snadsruelavaE(un espace fini, ou une partie deR, ou deRksleepsoa`seemdeesreorbeln,alleypssy)adte’nere’d tirer des conclusions. LaStatistique Descriptives’eff´eprntseioatnsorecedrtuoevdrseer simplifie´esdecesdonne´esene´tudiantcertainesdeleurscaracte´ristiques,commeleur moyenne,etc,brefdetrouverdesr´esum´esparlantsdecegrosensembledechiffres. Les techniquesade´quatesrele`ventdel’Analyse des don s ´ulgsopueuqen´´ealerenemectd nee l’on appelle en anglaisData AnalysisL.ree´ustltaitevtaliuauqeoivptricsededute´enutse dugenre“onvoitque...”ou“onconstateque...”,maispasdetyped´ecisionnel. Pourprendredesde´cisionsousimplementvaliderlesconclusionsd’uneanalysedescrip-tivededonne´es,onarecoursauneautreapproche,celledelaeiusatStqitame´htaMeuqit, ` laquelleconsid`erequelesdonn´eesxi∈Essiae´ectneremsdtno´rselieatisas(onsnpa ind´ependantesetidentiquementdistribue´es,enabre´g´ei.i.d.)d’unm´ecanismeale´atoire. Lastatistiquemath´ematiquepostulequ’ilexistedesvariablesouvecteursal´eatoiresXi de (Ω,A) dansEmuni d’uneσ-`glaerbeEty(qupienemortbuee´ilneent)leelqsxi=Xi(ω). Oncherchealorsa`obtenirdesinformationssurlem´ecanismestochastiquequig´ene`reles Xiuantitat,detypeqfie(ntnoselitiaut`eentoisnoitamrofnisecr,c’eoljielruidertsa` plusqualitatif)pourprendredesde´cisionsdutypesuivant:commentfaut-ilconstruire cettediguepourqu’ellepuisser´esister`ala“cruedusi`ecle”,ceme´dicamentnouveauest-il toxique, efficace, . . . ?
Prenons l’exemple desessais de Bernoulliqui recouvre diverses situations pratiques assezsimples:lejeudepileoufaceestmod´elis´eenprobabilite´sparunesuitedevariables inde´pendantesX1, . . . , XnemedBediolemteer1ernoullideparam`/n2toe´eB(1,1/2) ; la ˆ suitedesapparitionsduze´roa`laroulettepeutˆetrevuecommeunesuitedevariablesde Bernoulliinde´pendantesdeparam`etre1/tceusionleranp,o´gsue´nee`inlper3e7r.eDredm´a unesuitedevariablesale´atoiresi.i.d.Y1, . . . , Ynvala`adsnuesrceunairtspneepacabor-bilise´(E,E)ainsiqu’un´ev´eenemtnA∈Eet fixerXil1=A(Yi). On obtient alors une autresuited’essaisdeBernoulli(variablesale´atoiresa`valeursdans{0; 1}teeredapar`m) p=P[Yi∈A] =P[Xi= 1]. EnProbabilit´es,onsupposequepetsocelaentdopmometrssercuae’ins´entuenn’otl suite desXi,aapnord´rpe.nO“:setnaviussnoitesquux,alempxerebilit´euqleelseltpaorab que dans la suite desXion trouvektevause`t,”’c“euqdarifsloialavr1euP[N=k] siN=in=1Xi”. On sait queNsuit une loi binomialeB(n, p) et queP[N=k] = knpk(1−p)n−kpour 0≤k≤n, queE[N] =npet Var(N) =np(1−p). On peutausside´montrerdesre´sultatsasymptotiquesquandn→+∞comme laLoi des grands nombres:N/n→pp.s. et lelhTe´ro`emeLimiteCentra(TLC) :n−1/2(N− np)N(0, p(1−p)) (convergence en loi), etc. En Statistique, on raisonne en sens inverse. On ne connaˆıt paspmais on observe une re´alisationx1, . . . , xn, avecxi=Xi(ω), de la suite d’essais de Bernoulli et l’on utilise cesobservationspourde´duiredesinformations(ne´cessairemental´eatoires)concernantla valeur inconnue dep.
Exemple 1unnouvealetesteremtntee´mue´idacSpoupvno’liuesnosleuqosreulavn effi´eticacpecnuiatrjbonitceguf(ri´er,orablepa´tqeibilad’au’ilndretteireuiqntse´epr apaiserladouleur,etc.).Onadministreleme´dicamenta`npersonnes malades et l’on observe pour chacune s’il est effinodalec,encaon.necuome`inErppproereationxima unesuited’essaisdeBernoullideparam`etrepnnsoenememmˆaieruoptrftiaerelO.pnue testerlatoxicit´ed’unenouvellemole´cule,saufque,danscecaslesessais,dansunpremier temps, ne se feront pas sur des humains.
Exemple 2urfaireuneenquˆeoPeogrrtenipo’detnino,noinpersonnes afin de savoir sielless’int´eressentounon`atelproduitou,danslecasd’une´electionavecdeuxcandi-dats,siellesvoterontpourl’unoupourl’autre.L`aencore,onpeutadmettre,enpremie`re approximation,qu’ils’agitd’unesuited’essaisdeBernoullideparam`etrep,rpboabilit´e qu’unepersonnepriseauhasards’int´eresseauproduitouvotepourtelcandidat.
Exemple 3Pour savoir si un processus de fabrication fonctionne correctement, on analysenreragerno’bmoneledpduroe´uqltesfstiirbaNel’´dsdntme´e-tceue´efneuoxuD. veau,enpremi`ereapproximation,onpeutadmettrequecenombresuituneloibinomiale B(n, p`u)opdnu’de´tilibaborapelgnsi´ededrvleelaluqoi,nicatfabrutde´efameemntt´aiidev ˆetretre`spetite.