LA SIMULATION EN STATISTIQUE

icon

19

pages

icon

Français

icon

Documents

Écrit par

Publié par

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

19

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

REPERES - IREM . N° 47 - avril 2002
LA SIMULATION
EN STATISTIQUE
Philippe DUTARTE
CII Lycées Technologiques
Enseignant la statistique depuis déjà collègues dès la classe de seconde. Après un
quelques années en sections de techniciens supé- exposé de ce qu’est la simulation en statistique
rieurs, il me semblait que le travail des élèves, et comment elle est théoriquement possible,
dans ce domaine, se limitait trop souvent à appli- nous en verrons quelques utilisations péda-
quer des formules et effectuer quelques cal- gogiques (les programmes donnés sont ceux
culs, dans des situations vite identifiées, cor- utilisés par les élèves, en seconde ou BTS).
respondant à celles des sujets d’examen.
La «déraisonnable» efficacité des méthodes 1. Qu’est-ce que la simulation ?
statistiques, malgré le contexte aléatoire,
leur réelle capacité à prévoir, dans certaines Le développement des moyens de calcul
limites, le dosage entre prise de décision et informatiques a modifié bien des pratiques
risques, tous ces aspects, essentiels, étaient scientifiques. La statistique ne fait pas excep-
occultés. C’est ainsi que le recours à la simu- tion : l’ordinateur ou la calculatrice permet-
lation est apparu comme un moyen de repla- tent assez simplement d’expérimenter des
cer concrètement l’aléatoire au cœur de la situations aléatoires, par simulation à partir
problématique statistique et de montrer l’effi- d’une loi donnée, en les répétant un grand
cacité réelle des formules exposées en ...
Voir icon arrow

Publié par

Nombre de lectures

159

Langue

Français

REPERES - IREM . N°47 - avril 2002Enseignant la statistique depuis déjàquelques années en sections de techniciens supé-rieurs, il me semblait que le travail des élèves,dans ce domaine, se limitait trop souvent à appli-quer des formules et effectuer quelques cal-culs, dans des situations vite identifiées, cor-respondant à celles des sujets d’examen. La «déraisonnable» efficacité des méthodesstatistiques, malgré le contexte aléatoire,leur réelle capacité à prévoir, dans certaineslimites, le dosage entre prise de décision etrisques, tous ces aspects, essentiels, étaientoccultés. C’est ainsi que le recours à la simu-lation est apparu comme un moyen de repla-cer concrètement l’aléatoire au cœur de laproblématique statistique et de montrer l’effi-cacité réelle des formules exposées en cours.Avec les nouveaux programmes des lycées, cetteexpérience, acquise en sections de techni-ciens supérieurs, peut sans doute être utile auxELNA   SSTIAMTUISLTAITQIOUENPhilippe DUTARTECII Lycées Technologiquescollègues dès la classe de seconde. Après unexposé de ce qu’est la simulation en statistiqueet comment elle est théoriquement possible,nous en verrons quelques utilisations péda-gogiques (les programmes donnés sont ceuxutilisés par les élèves, en seconde ou BTS).1. Qu’est-ce que la simulation ?Le développement des moyens de calculinformatiquesa modifié bien des pratiquesscientifiques. La statistique ne fait pas excep-tion : l’ordinateur ou la calculatrice permet-tent assez simplement d’expérimenter dessituations aléatoires, par simulation à partird’une loi donnée, en les répétant un grandnombre de fois. On verra que la loi des grandsnombres en permet une justification. Il pour-ra s’agir, soit d’étudier les conséquences d’unmodèle, en le faisant «tourner», soit de conjec-39
LEAN   SSITMATUILSATITIQOUENREPERES - IREM. N°47 - avril 2002turer certains résultats, là où le calcul est tropconjecturer des résultats non triviaux et noncompliqué, ou impossible.intuitifs, comme par exemple d’évaluer laprobabilité d’observer au moins six lancers consé-Selon Emile Borel1, «le but principal ducutifs égaux sur 200 lancers.calcul des probabilités[...] est de calculer lesprobabilités de phénomènes complexes en fonc-Le programme sur calculatrice ci-des-tion des probabilités, supposées connues, de phé-sous (utilisé en seconde) calcule, pour 200nomènes plus simples ».En statistique, c’estlancers de pile ou face simulés (on verra com-à partir d’observations que l’on évalue desment plus loin), la longueur maximale des lan-probabilités. La simulation permet de fabri-cers consécutifs égaux.quer de telles observations, à partir de pro-babilités simples, supposées connues, et ainsiCinq simulations ont donné, par exemple,de se faire une idée de la qualité des procé-comme longueurs maximales de lancers consé-dures employées.cutifs égaux sur 200 lancers : 8 ; 7 ; 6 ; 11 ; 7.Sur 200 lancers consécutifs, on a, à chaque fois,observé au moins 6 lancers consécutifs égauxa — Des exemples(et parfois beaucoup plus). Ce qui est assezcontraire à l’intuition. Bien sûr, cinq simu-— Dans le jeu de pile ou face, intéressonslations, ce nest pas assez pour faire des sta-nous, par exemple, aux séries de lancerstistiques. On verra plus loin comment utili-consécutifs égaux. La modélisation (admise)ser le théorème limite central pour déterminerconsiste à dire quà chaque lancer, on a «unecombien effectuer de simulations pour évaluerchance sur deux» davoir pile ou davoir facecorrectement la probabilité davoir au moins(cette probabilité de 1/2 est admise). Dans le6 lancers consécutifs égaux sur 200 lancers decadre de ce modèle, la simulation permet depile ou face.CASIO Graph 25 100T.I. 80 - 82 - 83Seq(1,I,1,2,1) List 1:1 AInt(Ran# + 0.5) R:1 MFor 1 I To 200:int(rand + 0.5) RInt(Ran# + 0.5) S:For(I,1,200)If S = R:int(rand + 0.5) SThen List 1[1] + 1 List:If S = R1[1]:ThenS R:A + 1 AMax(List 1) List 1[2]:S RElse 1 List 1[1]:max(A,M) MIfEnd:ElseS R:1 ANext:EndList 1[2]:S R::EMnd1 Emile Borel – «Les probabilités et la vie»«Que sais-je»P.U.F. 1947.49T.I. 89 - 92a 1:m 1::int(rand( ) + 0.5) r:For i,1,200:int(rand( ) + 0.5) s:If s = rnehT::a + 1 ar s::max(a,m) meslE:a 1::EndIfr s::EndFor:Disp m
REPERES - IREM. N°47 - avril 2002Dans cette situation, le calcul est en faitpossible (mais pas immédiat). La probabilitéqu’une suite de 200 lancers de pile ou facecontienne au moins une série de 6 lancersconsécutifs égaux est environ 0,965 (voirl’encadré ci-contre).— Prenons un second exemple dans un cas pra-tique.On cherche à étudier le temps de rota-tion moyen d’un bus, selon la configura-tion d’une ligne urbaine. On a modélisé lasituation. Le temps d’arrêt à chaque stationest aléatoire, en fonction du nombre de des-centes et de montées (selon un processus dePoisson). De même, le temps entre deux sta-tions dépend des aléas de la circulation.On peut alors, dans un programme, simu-ler les différentes variables aléatoires inter-venant ici (dont le choix aura été déterminéselon un historique statistique), puis les com-biner de façon à simuler une rotation du bus.Ayant simulé ce modèle, on peut alors le faire«tourner» un grand nombre de fois et éva-luer, entre autres, le temps moyen de rotationd’un bus (mais aussi observer les phénomènesd’attente).b — Une définitionComme on vient de le voir, simuler uneexpérience aléatoire consiste à produire «vir-tuellement» des résultats analogues à ceux quel’on aurait obtenus en réalisant «physique-ment» l’expérience aléatoire. Une définition plus précise de la simula-tion est donnée par Yadolah Dodge2 :2 Statistique. Dictionnaire encyclopédique. Dunod 1993ELAN   SSTIAMTUISLTAITQIOUENLa probabilité qu'une suite de 200lancers de pile ou face contienne aumoins une série de six lancers consécutifs égaux est environ 0,965Notons unle nombre de suites de n lancersde pile ou face (xi) , avec i de 1 à n, ne conte-nant aucuneséquence de 6 consécutifségaux.Une telle suite peut être de 5 types diffé-rents , en considérant les 6 derniers termes,dénombrés ainsi :xn – 1xn: il y a un – 1telles suites.xn – 1= xnet xn – 2xn – 1: il y a un – 2telles suites.xn – 1= xn; xn – 2= xn – 1et xn – 3xn – 2:il y a un – 3telles suites.xn – 1= xn; xn – 2= xn – 1; xn – 3= xn – 2etxn – 4xn – 3: il y a un – 4telles suites.xn – 1= xn; xn – 2= xn – 1; xn – 3= xn – 2et xn – 4= xn – 3et xn – 5xn – 4: il y a un – 5telles suites.uLa probabilité cherchée est donc 2000022la suite (un) est définie par :u1= 2 ; u2= 4 ; u3= 8 ; u4= 16 ; u5= 32 puis un= un – 1+ un – 2+ un – 3+ un – 4+ un – 5pour n 6.Ceci permet le calcul de u200de proche enu002proche. On a ainsi ——0,965313.0022« La simulation est la méthode statistiquepermettant la reconstitution fictivede l’évo-lution d’un phénomène. C’est une expéri-95
ELAN   SSITMATUILSATITIQOUNEmentationqui suppose la constitutiond’un modèle théoriqueprésentant une simi-litude de propriétés ou de relations avec lephénomène faisant l’objet de l’étude. »Ceci peut être schématisé ainsi :DonnéesexpérimentalesModélisation SimulationProbabilitésEn produisant des données, sous un cer-tain modèle, la simulation permettra d’exa-miner les conséquences, souvent non évi-dentes, de ce modèle, et, éventuellement, sonadéquation aux données réelles. De façongénérale, la simulation permet d’obtenir (oude conjecturer) des résultats difficiles, ouimpossibles, à calculer (c’est dans ce cadre qu’elleest utile aux statisticiens)3.Pour imiter le hasard, les simulationssont basées sur le calcul de nombres pseudo-aléatoires qui, non seulement sont imprévi-sibles, mais encore ont le «goût» (statisti-quement) du hasard.3 Il existe également des simulations non aléatoires (dansl’étude de systèmes dynamiques, par exemple).69REPERES - IREM. N°47 - avril 20022. Comment peut-on simuler le hasard ?a — Hasard ou pseudo-hasard ?Les premières tables de nombres auhasard ont été construites à partir des numé-ros gagnants de la loterie. Cette pratiquea conduit à désigner par «méthode de Monte-Carlo»les procédés de calcul d’aire utilisantces nombres au hasard. Ainsi, alors que le sta-tisticien Karl Pearson(1857-1936) eut beau-coup recours à des lancements de pièces oude dés, embauchant pour ce faire amis etélèves, son fils Egon Pearson(1895-1980), àl’origine de la théorie des tests, utilisa cequ’on appela plus tard la simulation, grâceà des tables de nombres au hasard produitesdans les années 1925. En 1955, la Rand Cor-porationédita une table «A Million RandomDigits»obtenue à partir de bruits de fondélectroniques(fluctuations du débit de tubesélectroniques). Il s’agit alors d’un généra-teur aléatoire physique.Avec l’apparition des ordinateurs, onchercha à générer des nombres aléatoires, àl’aide d’algorithmes. Il ne s’agit plus dehasard physique mais d’un hasard calculé. Oncomprend bien l’antagonisme entre les deuxtermes. On ne peut pas calculer des nombresau hasard, puisqu’il sont alors le résultatd’un algorithme déterministe.Cela nous conduit à nous poser la ques-tion : «quand peut-on dire qu’une suite denombres est une suite au hasard ?» On peutse limiter à une suite de 0 et de 1, et la ques-tion devient : «quand peut-on considérerqu’une suite de 0 et de 1 est une suite auhasard ?» C’est à dire résultant d’un tirage àpile ou face, ou encore, de façon plus mathé-matique, comme étant les résultats successifs
REPERES - IREM. N°47 - avril 2002d’une suite de variables aléatoires Xiindépendantes et valant 0 ou 1 avec une pro-babilité 0,5.Cette question est mathématiquementtrès difficile. Une réponse théorique à étéapportée en 1966 par Martin-Löf: « Une suitede chiffres est aléatoire quand le plus petit algo-rithme nécessaire pour l’introduire dans l’ordi-nateur contient à peu près le même nombre debits que la suite ». Cette définition, exclutdonc toute possibilité d’une règle effective.Un objectif plus raisonnable est de trou-ver un algorithme produisant une suite denombres, telle qu’un statisticien en l’analysant,ne soit pas capable de détecter si elle a été pro-duite par un procédé mathématique ou un réelphénomène aléatoire physique : qu’il lui soitimpossible, par exemple, sur une suite assezgrande de 0 et de 1 (disons 200) de savoir s’ilsont été générés par un ordinateur, ou en lan-çant une pièce de monnaie bien équilibrée. Unetelle suite est pseudo-aléatoire. Ces suites,construites sur des procédés récurrents, sontnécessairement périodiques, puisque l’on tra-vaille avec un nombre fini de décimales. Oncherche donc à ce que la période soit trèsgrande et il faut être sûr de son générateurlorsque l’on a besoin d’une très grande quan-tité de nombres au hasard.Pour simuler une variable aléatoire de loidonnée, le principe consiste à «déformer» ungénérateur de nombres pseudo-aléatoires cor-respondant à une distribution uniforme surl’intervalle [0, 1].b - Simuler une distribution uniforme sur [0 , 1]La plupart des générateurs de nombres(pseudo) aléatoires, simulent le tirage auELAN   SSTIAMTUILSATITQIOUNEhasard d’un nombre réel (ou plutôt décimal)entre 0 et 1. De façon plus précise, on simu-le les réalisations d’une suite de variablesaléatoires indépendantes Xide même loi U ([0 , 1]).Les procédés les plus courants consis-tent en des suites récurrentes, de grandepériode, et dont le comportement chaotiquesatisfait à divers tests statistiques, per-mettant de valider l’hypothèse qu’il s’agit deréalisations de X(un premier test peut seconstruire sur l’observation des fréquencesd’apparition des différents chiffres).Un premier exemple de générateur de nombres aléatoires dans [0 , 1]Si les constructeurs de calculatricesactuels ne donnent pas de renseigne-ment quant à leur générateur de nombresaléatoires, ce n’était pas le cas dans lesannées soixante dix, où le générateursuivant correspond à un ancien modèlede calculatrice Hewlett-Packard.En mode habituel de calcul, effectuer :— Sur CASIO, 0.5 X EXE puis Frac (9821X + 0.211327) X EXEet appuyer plusieurs fois sur EXE.— Sur T.I. , 0.5 X ENTER puis fPart(9821X + 0.211327) X ENTERet appuyer plusieurs fois sur ENTER.Il s’agit donc d’une suite (xn) définie par récur-rence par x0= 0,5 et xn+1= partie fraction-naire de 9821xn+ 0,211327 . 79
LEAN   SSITMATUILSATITQIOUENEn voici les dix premiers termes :0,713270,2379400020,0220286410,556555230,1421800720,5637538430,8397579390,4759911810,922662850,685117385Le graphique des 100 premiers termes, cal-culés sur Excel, montre son caractère chao-tique. (Ces suites, chaotiques, diffèrent sou-vent selon le type de calculateur). Reste àvérifier qu’elle possède les propriétés statis-tiques de la loi uniforme sur [0, 1]…Un second générateur obtenu selon la méthode de Lucas-LehmerDe nombreux générateurs sont obtenusà partir de propriétés arithmétiques, en par-ticulier suite aux travaux de Lehmer, dans lesannées soixante dix. Certaines suitescongruentes possèdent, en effet, des proprié-89REPERES - IREM. N°47 - avril 2002tés structurelles démontrées, comme la gran-de longueur de leur période (pour les pro-priétés arithmétiques, voir l’encadré ci-contre),qui en font, a priori, de bons candidats pourservir de générateur aléatoire. On leur fait subirensuite toutes sortes de tests statistiques (onen verra des exemples plus loin) pour sélec-tionner le plus satisfaisant. Mais, cette fois,il n’y aura pas de certitude. La méthode sta-tistique ne démontre pas qu’un générateur donnéest toujours satisfaisant pour une simulationdonnée.On choisit des entiers aet mpremiers entreeux (mgrand, souvent un nombre premier),puis on construit la suite (rn) d’entiers posi-tifs de [0 , m-1], définie à partir d’une valeurr0, non nulle et première avec m, et de la rela-tion de récurrence :rn + 1= arnmod(m) ,c’est à dire que rn + 1est le reste de la divisioneuclidienne de arnpar m.rLa suite (xn) définie par xn= nfournit, mpour certains choix de aet m, un générateurde nombres aléatoires dans [0 , 1].Le choix de aet mdépendent de la confi-guration de l’ordinateur. Pour un modèle IBMdes années 80, on avait choisi : a= 75; m= 231– 1 ; rn + 1= arnmod(m) puis xn= rn/ m.On donne page suivante les premièresvaleurs de (xn), obtenue sur Excel, avec :57 =am= 231– 1et en débutant avec la valeur r0= 5.
REPERES - IREM. N°47 - avril 2002ELAN   SSTIAMTUISLTAITQIOUENPropriétés arithmétiques de la suite rn+1= arnmod(m)0 < r0< m, r0et apremiers avec mTout dabord, pour tout n dans Non a rnnon nul et premier avec m.En effet, rn= 0 impliquerait l’existence d’un entier ktel que arn– 1= kmmais, puisque mest premier avec a, le lemme de Gaussdonnerait que mdivise rn– 1, c’est- à-dire : rn– 1= 0(rn– 1est un reste modulo m). Par récurrence, on remonterait à r0= 0, ce qui est exclu.De même, s’il existait ddiviseur commun à rnet m, alors ddiviserait arn– 1et, puisque mest premier avec a, le lemme de Gaussdonnerait que ddivise rn– 1. On remonterait à ddivise r0qui est exclu.Dans ces conditions, la suite (rn) a pour période l’ordre multiplicatif de amodulo m, c’est-à-dire le plus petit entier ktel que a k= 1 mod m. En effet :rn+ t= rnatrn= rnmod(m) (at– 1)rn= kmavec kentier, c’est à dire, puisque rnest pre-mier avec m, at= 1 mod m.Lorsque mest premier, le petit théorème de Fermataffirme que si mest premier et nedivise pas a, alors am-1= 1 mod(m) , donc, pour apremier avec m, l’ordre multiplicatif deadivise m– 1.Un théorème de Legendreassure alors, pour mpremier, l’existence de nombres d’ordre mul-tiplicatif maximum m– 1 modulo m.Par exemple, modulo 5, le nombre 2 est d’ordre multiplicatif maximum 4 car 22= 4 mod(5)puis 23= 3 mod(5) et 24= 1 mod(5) .Il n’existe malheureusement pas d’algorithme permettant de trouver ces nombres d’ordremaximum. Le théorème de Legendreprécise cependant qu’entre 1 et m– 1 , il en existe ϕ(m– 1) correspondant au nombre d’entiers premiers avec m– 1 dans {1 , 2 , ... , m– 2}.Les nombres d’ordre maximum ne sont donc pas rares, et, avec l’aide de l’ordinateur, on peuttrouver un tel a, qui nous assurera une suite dont la plus petite période est m– 1, métantun très grand nombre premier.Lorsque mn’est pas premier, un théorème d’Eulerdonne que, si aet msont premiers entreeux, alors aϕ(m)= 1 mod(m) où ϕest l’indicateur d’Eulercorrespondant au nombre d’entierspremiers avec mdans {1 , 2 , ... , m– 1}. Ainsi, l’ordre multiplicatif de aest alors un divi-seur de ϕ(m). Mais on n’est pas assuré qu’il existe un tel nombre d’ordre multiplicatif maxi-mum ϕ(m), modulo m.Par exemple, ϕ(21) = 12 et, modulo 21, l’ordre multiplicatif de 5, par exemple, est 6 (56= 1 mod(21) ) qui est un diviseur de 12 et l’ordre multiplicatif maximum, modulo 21.99
ELAN   SSTIAMTUILSATITQIOUENLes 100 premiers termes du second généra-teur sont :(n=2 ) 0,65768894100,,727983022560661610,6638361870,09479593200,,3293453222335088410,3964820290,6734644800,,951977501801388670,1548267310,17286055300,,6246875300089167750,355746920,0384909310,91707825400,,038374422191817828Remarque : Le nombre 231– 1 est un nombrede Mersennepremier.Les nombres de Mersennene sont pastous premiers (la calculatrice TI 89 donne, parexemp30le, en fa2isant « factor(2^30 –1) » : 2 1 = 3×7×11×31×151×331 ) ,mais leur intérêt réside dans le fait qu’il exis-001REPERES - IREM. N°47 - avril 2002te un test (découvert par Lucasen 1878) per-mettant de savoir s’ils sont premiers, et queleur manipulation est très commode dans lesystème binaire des ordinateurs, puisque 231– 1 s’écrit avec 31 chiffres 1 consécutifs.Edouard Lucas(1842-1891), professeur aulycée St-Louis, puis Charlemagne, à Paris, estcélèbre pour ses résultats en théorie desnombres, et ses «Récréations mathématiques»(il est l’inventeur du problème des «Tours deHanoï»).Tester un générateur de nombres aléatoiresOn construit, à partir de la suite (xn)fournie par le générateur, une suite de chiffresaléatoires parmi 0, 1, 2, ..., 9, en faisantEnt(10 xn) où Ent désigne la partie entière,instruction qui ne retient que la premièredécimale.Le premier test à effectuer est celui desfréquences d’apparition des différentschiffres. Chaque chiffre doit avoir une pro-babilité 1/10 de sortir, et sur nchiffres consé-cutifs fournis par le générateur, la fréquen-ce observée d’un chiffre doit se répartir,suivant les échantillons, approximativement19×selon la loi normale N (1,1010) (d’après01nle théorème limite central).La dispersion «normale» des fréquencesobservées, sur des échantillons de taille n, doitdonc se faire, si le générateur est bon, avec un0,3écart type σ= , cest-à-dire 0,03 si n= 100 net 0,0095 si n= 1000 (il est à noter qu’une dis-
REPERES - IREM. N°47 - avril 2002persion trop faible est aussi suspecte que lecontraire !). D’après les propriétés de la loi nor-male, on devrait donc avoir 95 chances sur 100d’observer les fréquences d’apparition d’unchiffre à moins de 2σde 1/10, alors qu’un écartde 3σest peu probable.Ainsi, sur des échantillons de taille n= 100, on a 95% de chances d’observer la fré-quence de sortie d’un chiffre dans la bande [0,04 ; 0,16], alors que pour des échantillonsde taille n= 1000, les fréquences doivent, à95%, se situer dans la bande [0,08 ; 0,12].ELAN   SSTIAMTUISLTAITQIOUENOn peut donc construire un premier test sta-tistique, en écartant un générateur fournis-sant trop fréquemment une fréquence endehors de ces intervalles.En conservant la première décimale desrésultats des deux générateurs précédents, onobtient les graphiques ci-dessous. On observe que le premier générateur afourni, pour n= 1000, un nombre exception-nellement bas de 8, ce qui, sans le discrédi-ter totalement, le rend un peu suspect.101
ELAN   SSITMATUILSATITIQOUNEUn second contrôle peut être celui dupoker, où l’on regroupe consécutivement leschiffres par quatre et où l’on compare les fré-quences des différentes configurations possiblesà leur probabilité :Configuration :Proba :Chiffres différents 63900,504Une paire 93900,432Deux paires 93930,0273 chiffres idem 93990,0364 chiffres idem 99990,001Pour le générateur ALEA() d’Excel, onobserve par exemple (sur deux expériences),pour 1000 groupes de quatre chiffres, leseffectifs xisuivants, à comparer aux valeursthéoriques ti:Configu-expéri-expéri-rationence 1ence 2tiChiffresx1= 541497504différentsUne pairex2= 409439432Deux pairesx3= 1831273 chiffresx4= 323236medi4 chiffresx= 0115mediUne certaine fluctuation des observa-tions est attendue, mais dans quelles limites? On peut mesurer l’adéquation des obser-vations xiaux valeurs théoriques correspon-201REPERES - IREM. N°47 - avril 2002dantes tien introduisant l’écart quadratiqueréduit :25(xiti)2χobs= i=1ti.Pour étudier la variabilité de ce critère, on intro-duit les variables aléatoires Xiqui, à chaqueéchantillon de 1000 groupes de quatre chiffresconsécutifs, associent le nombre de configu-rations de type i, ainsi que la variable aléa-255toire T=(Xiti), avec Xi=1000.i=1tii=1La loi de Tsuit approximativement uneloi tabulée et connue sous le nom de loi du χ2à quatre degrés de liberté (en effet la relationci-dessus fait que la valeur de X5est déterminéedès que les valeurs de X1 , X2 , X3 et X4 sontconnues).La table permet alors d’obtenir : P(T9,48) 0,95.On pourra alors considérer comme suspect2d’observer une valeur de χobssupérieure à 9,48.Pour les échantillons obtenus précédem-ment avec le générateur aléatoire d’Excel, on: a22χobs18,39 et χobs21,25.Un générateur de nombres aléatoires existesur toutes les calculatrices sous la forme dela touche random4: Ran#(CASIO) ourand(T. I.).4 Le mot randomsignifie «hasard» en anglais, il vient du vieuxfrançais randon, que l’on retrouve dans randonnée.
Voir icon more
Alternate Text