Universite de Nice SV1 annee Departement de Mathematiques Mathematiques pour la Biologie semestre

icon

4

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

4

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

Niveau: Supérieur
Universite de Nice SV1, annee 2010-2011 Departement de Mathematiques Mathematiques pour la Biologie (semestre 1) Cours 8 : Series statistiques a une et deux dimensions Cette lec¸on introduit les outils statistiques de base qui seront utilises dans les deux prochaines lec¸ons consacrees a la regression lineaire. Ces outils servent a etudier des series statistiques, en les localisant (par leur moyenne), en quantifiant leur dispersion (par leur variance ou leur ecart-type) et, lorsqu'il y en a plusieurs, en comparant leurs variations (par leur covariance et leur correlation). 1 Series statistiques a une dimension Une serie statistique est simplement une suite de mesures comme par exemple la suite, mesuree en centimetres des tailles de 20 plants que l'on etudie (presentees par ordre croissant) : 9, 3 9, 7 10, 1 10, 2 10, 4 10, 6 10, 7 10, 7 10, 9 11 11, 1 11, 1 11, 3 11, 3 11, 6 11, 7 11, 9 12, 3 12, 4 13, 4. Par la suite on designera par xi une telle suite, l'indice i prenant les valeurs entieres de 1 a n (ici n = 20, x1 = 9, 3, x2 = 9, 7, ...). Pour comprendre une telle serie la premiere idee est de la representer a travers un histogramme.

  • covariance

  • nuage

  • nuage de point

  • departement de mathematiques mathematiques pour la biologie

  • moyenne des produits des ecarts

  • variance de donnees exprimees en cm

  • etendue de la serie


Voir icon arrow

Publié par

Nombre de lectures

15

Langue

Français

Universit´edeNice D´epartementdeMath´ematiques
SV1,ann´ee2009-2010 Math´ematiquespourlaBiologie(semestre1)
Cours8:Se´riesstatistiquesa`uneetdeuxdimensions
Cettele¸conintroduitlesoutilsstatistiquesdebasequiserontutilis´esdanslesdeuxprochainesle¸cons consacre´esa`lar´egressionline´aire.Cesoutilsservent`a´etudierdesse´riesstatistiques,enleslocalisant (parleurmoyenne),enquantiantleurdispersion(parleurvarianceouleure´cart-type)et,lorsquilyen aplusieurs,encomparantleursvariations(parleurcovarianceetleurcorr´elation).
1S´eriesstatistiquesa`unedimension Uneers´isatstieeuqittseemelpmislaleitsumee,r´suneeentunesuitedemesuercsmoemaperexpm centime`tresdestaillesde20plantsquelone´tudie(pre´sente´esparordrecroissant): 9,3 9,7 10,1 10,2 10,4 10,6 10,710,7 10,9 11 11,1 11,1 11,3 11,3 11,6 11,7 11,9 12,3 12,4 13,4. Parlasuiteonde´signeraparxiune telle suite, l’indiceinesre`itdsera`1erepntnasvleeualn(icin= 20, x1= 9,3,x2= 9,`atrnter´eserepredaleetsdie´e`ermireapelri´eeslletenuerdnerpmocr,7..).P.uorevanus histogramme.Anotercependantquilnyapasunefa¸conuniquedelefaire.Parexemple,pourlepremier histogrammeci-dessous,onaregroupe´lesmesurescomprisesentre9et10(ici2mesures),puiscelles comprises entre 10 et 11 (ici, 8 mesures), et ainsi de suite. Dans le second histogramme, qui correspond auxmˆemedonn´ees,lesintervallesdeclassesnesontplusduncentime`tremaisdundemicentim`etre.
0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 8 9 1011 12 13 14
0.50 0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 8 9 1011 12 13 14
Maisquelquesoitlafa¸condontonproce`depourtracerlhistogramme,onfaitensortequelasurface quiloccupe(sommedessurfacedesbarres)soit´egalea`1.Ainsi,pourunese´riede20termes,silalargeur declassesest1(commedanslepremierhistogramme),lahauteurdesbarresserae´gale`aleectifdela 1 classemultiplie´par=0,05 ;mais si la largeur des classes est 0,rgotemmala,)isrol5(deuxi`emehis 20 1 1 faudramultiplierpardeuxlunit´eenhauteurenpassantdea`. 20 10
Moyenne : Lhistogrammefournitunbonre´sume´graphiquedesdonn´ees,toujoursutilepourcommencerlanalyse dunes´erie,maisleplussouventilfaudralacompagnerdautresre´sume´s,quantitatifscettefois,dontles plusutilis´essontlamoyenne,lavarianceetl´ecart-type. D´enition:Lamoyenneeistselpmdonnmentar´eep n X 1 1 µ= (x1+x2+x3+. . .+xn) =xi. n n i=1
Lamoyennedelase´riedes20mesuresdenotreexempleest´egalea`11,8. C’est une grandeur que l’on appelle unionositedep`etrramapparce qu’elle indique autour de quelle valeur (ici 11,8) se situent les mesuresdelas´erie.
1
Maissilonsentenait`alamoyenneonnesauraitriensurl´etenduemeeeu:d´exsesrimˆdeed´saleire moyennepeuventˆetretr`esdi´erentes,luneregroupe´eautourdecettemoyenneetlautreaucontraire tr`esdisperc´ee.Onadoncbesoindunautreparame`trequi,lui,quantiecettee´tendue.
Varianceete´carttypedunese´rie Conside´ronsunexemple.Soitlase´rie 12,1 16,3 13,2 13,5 14,9 dontlamoyenneest14.Lapremie`reid´eeestdecalculerpourchaquetermedelas´erieleur´ea`alactr moyenne:41a`trace´rueilicredia--`stec 1,9 2,30,80,5 0,9 Ontrouvetrois´ecartsne´gatifscorrespondanta`desmesuresinf´erieures`alamoyenneetdeuxe´carts positifscorrespondanta`desmesuressupe´rieures`alamoyenne.Commemesuredel´etendue,onpeut avoirlid´eedefairelamoyennedeces´ecarts 1,9 + 2,30,80,5 + 0,9 0 = =0. 5 5 Maisonvoitquecettemoyennenestpasunebonnemesuredele´tendueetenfait,unpetitcalculpermet dev´erierquecettemoyenneseratoujoursnulle.Pourcontournercettediculte´,onpeutavoirlid´eede 1,9+2,3+0,8+0,5+0,9 fairelamoyennedese´carts,maisenlescomptanttouspositivementcettefois=1,28. 5 Onobtientunequantit´equelonappellelaneionmoyenatvi´edaiemset´duenquiestserudeleibnenume quinestpaslaquantit´elaplussouventutilise´epourcela.Cellequelonutiliseenge´ne´ral(carellesave`re plus maniable dans les calculs) est la variance, ici 2 2 2 2 2 (1,9) +(2,(03) +,8) +(0,5) +(0,9) 10,6 = =2,12. 5 5 De´nition:Lavariancee(riund´eesxienc,etslamayone´ecarts`rr´esdesdennacsealtseyom)eredia--` n 2 22 X (x1µ) +(x2µ) +. . .+ (xnµ) 1 2 Var (x= () =xiµ). n n i=1
2 Anoterquelavariancededonn´eesexprim´eesencmesnee´emirpxearcm. Si l’on veut mesurer le´tenduedelas´erieenutilisantlesmeˆmesunit´esquelase´rieelle-mˆeme,ilfautprendrelaracinecarr´e de la variance. De´nition:L’´ecart type(ednusee´irxi) (an anglais,standard deviationrsaec)ernailctaasedee´r variance,cest-`a-dire n 2uX 2 2 (x1µ) +(x2µ) +. . .+ (xnµ) 1 t 2 σ(x= () =xiµ). n n i=1 Tr`essouvent,leshistogrammesdes´eriesstatistiquesontlaformeduneclochesemblablea`lacloche 2 xµ 12 de Gauss, graphe de la fonctionf(x) =e. C’est le cas notamment lorsque le nombrende 2σ σ2π termesdelas´erieestgrand.Pourcettecourbedere´f´erence,dontlesommetestsitue´enx=µ, on peut montrerque65%delasurfacetotale(quivaut1)estsitue´audessusdelintervalle[µσ, µ+σ]. De la mˆemefac¸on,onpeutmontrerque95%estsitue´audessusdelintervalle[µ2σ, µ+ 2σ]. On peut donc retenirque,tre`sgrossie`rement,unhistogrammeenformedeclocheestcentre´sursamoyenneµet son 2 e´tendueestpresqueconfondueaveclintervalle[µ2σ, µ+ 2σlnietvrlaeleauxaudessusdeste]´uti 3 [µσ, µ+σ].
Propri´ete´sdelamoyenneetdelavariance: Silonmodieunese´rie(xi) en (axi+b)p,er,shangeencemplarexuose´tinuseltnaesumeesedinigorlalorsilestfaciledeve´rierquelamoyenne,lavarianceetle´cart-typedelanouvelles´eriesexprimeen fonctiondecellesdelase´rieoriginaleparlesformulessuivantes:
2
Voir icon more
Alternate Text