Statistique

icon

15

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

15

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres


1
Statistique
Introduction
Dans les programmes, il est fait référence à l’ouverture du champ du questionnement
statistique et comme le dit Yves ESCOUFIER (Rapport de la Commission de Réflexion sur
l’Enseignement des Mathématiques de mars 2003) : « Il n’y a pas de pratiques statistiques
sans données ; il n’y a pas de données sans des questions issues des domaines scientifiques,
économiques, sociaux ou industriels qui justifient l’intérêt qu’on leur porte. »
L’élève de Seconde a eu l’occasion, dans sa scolarité antérieure, de mettre en œuvre un certain
nombre d’outils statistiques (relevés statistiques, graphiques, fréquences, moyennes…).
Parallèlement à cet apprentissage, il a eu l’occasion d’être initié à l’utilisation des tableurs.
Il faut maintenant poursuivre cette initiation et approfondir ces notions.
Nous avons voulu insister sur le fait que la statistique est une démarche (un ensemble de
méthodes, d’outils mathématiques) permettant de répondre, ou pour le moins d’apporter
des éléments de réponse, à des questions qui se posent dans de nombreux domaines
(sociologie, médecine, industrie…). C’est Daniel SCHWARTZ (Le jeu de la science et du hasard.
La statistique et le vivant) qui dit : « Les statistiques sont des dénombrements de sujets,
d’objets, d’événements, dans des populations ou des sous-populations. La statistique est
un mode de pensée permettant de recueillir, de traiter et d’interpréter les données qu’on
rencontre dans divers domaines, et tout ...
Voir icon arrow

Publié par

Nombre de lectures

104

Langue

Français

1Introduction StatistiqueDans les programmes, il est fait référence à l’ouverture du champ du questionnementstatistique et comme le dit Yves ESCOUFIER (Rapport de la Commission de Réflexion surl’Enseignement des Mathématiques de mars 2003): «Il n’y a pas de pratiques statistiquessans données; il n’y a pas de données sans des questions issues des domaines scientifiques,économiques, sociaux ou industriels qui justifient l’intérêt qu’on leur porte.»L’élève de Seconde a eu l’occasion, dans sa scolarité antérieure, de mettre en œuvre un certainnombre d’outils statistiques (relevés statistiques, graphiques, fréquences, moyennes…).Parallèlement à cet apprentissage, il a eu l’occasion d’être initié à l’utilisation des tableurs.Il faut maintenant poursuivre cette initiation et approfondir ces notions.Nous avons voulu insister sur le fait que la statistique est une démarche (un ensemble deméthodes, d’outils mathématiques) permettant de répondre, ou pour le moins d’apporterdes éléments de réponse, à des questions qui se posent dans de nombreux domaines(sociologie, médecine, industrie…). C’est Daniel SCHWARTZ (Le jeu de la science et du hasard.La statistique et le vivant) qui dit: «Les statistiquessont des dénombrements de sujets,d’objets, d’événements, dans des populations ou des sous-populations. La statistiqueestun mode de pensée permettant de recueillir, de traiter et d’interpréter les données qu’onrencontre dans divers domaines, et tout particulièrement dans les sciences de la vie, du faitque ces données présentent une caractéristique essentielle: la variabilitéPour répondre à la question qui se pose à lui, le statisticien se doit donc de recueillir desdonnées les plus fiables possibles (nécessité de mettre en œuvre des protocoles expérimentauxrigoureux). Il rencontre alors des problèmes liés à l’échantillonnage, problèmes qu’il se doitde comprendre et de maîtriser afin d’être capable de mesurer les risques qu’il encourt enchoisissant un modèle plutôt qu’un autre.Nous avons voulu, conformément aux programmes, proposer aux élèves de nombreusessituations dont une modélisation «spontanée» permet la compréhension de la situation.Les problèmes de validité des modèles utilisés restent évidemment en suspens: lamodélisation théorique est laissée de côté en attendant les éléments du calcul des probabilités(abordées en classe de Première).De toute façon, il ne faut pas oublier, comme le dit le grand statisticien britannique, G. BOX: «Tous les modèles sont faux, certains peuvent être utiles.». La calculatrice, et plus encore le tableur, permettent de traiter un grand ensemble dedonnées: l’élève est ainsi mis dans une situation proche du réel. Nous avons aussi,conformément au programme, développé l’utilisation d’une table de nombres aléatoires.1 - Statistique 1
euqitsitatS - 12.leiciffo emmargorp ud stiartxe :sarg nE.stneréffidsfitcejbo sed tnasiv snoitautis sed snad sérgétni tnos sénrecnoc stniop sel euq tnemelarénég siam ,seuqnam sed tia y liuq sap tneifingis en sediv sesac seL.naliB te tset-otuA ,ségirid xuavarT ,sulosér semèlborP ,rerolpxe ruop sétivitcA ,ehcorppA ruop tnemevitcepser B ,TA ,DT ,RP ,tcA ,ppA seéxiférp tnos snoitautis sertua seL.secicrexE euqirbur al ed sorémun sel tnos exiférp snas sorémun seL1tcA53-411RP03-72-42-71-61-31-21-112EDT-1EDT-3tcA52-9-8-7-6-51ppA.sertuA32-012ppA.tnemenévénud ecneuqérf al ed te sruelaved erbmon titep nu tnanerp eirésenud secneuqérf sed noitubirtsiD.secneuqérf sed noitubirtsidal ed ritrap à enneyom al ed luclaC.sepuorg-suos ed senneyom sed ritrapà eirés enud enneyom al reluclaC.euqitsitats eirés enud enneyom aled étiraénil ed sétéirporp sel resilitUContenus et objectifsdes activités, des exercices et des testsObjectif du chapitreNous avons proposé aussi souvent que possible la possibilité d’utiliser l’un quelconque deces outils et l’enseignant pourra ainsi choisir.Les deux thèmes «Moyenne» et «Sondage et fluctuation d’échantillonnage» complètentce chapitre.On peut trouver des compléments théoriques et didactiques, ainsi que des idées dans lesbrochures suivantes, dont l’auteur s’est grandement inspiré: Statistique probabilitééditée parla Commission INTER-IREM; Probabilités au lycéeéditée par l’APMEP; Simulation et statistiqueen Secondeet Enseigner la statistique au lycée: des enjeux aux méthodeséditées par l’IREM deVilletaneuse et Des statistiques à la pensée statistiqueéditée par l’IREM de Montpellier.2tcATTDDEE36  TTDDEE75  TDP1 TDP2 TDP3AT3 3119--3202--2313--2324--2386--37-38-39-40-41-42-43-4492AATT12  ABT14  4B15-18? 2B3BContenus du programme-2-1Population, caractère, échantillon.3-4-TDE462
ApprocheAu Collège, les élèves ont eu l’occasion detravailler sur des représentations graphiques etsur le calcul de fréquences (en liaison avec laproportionnalité). Le but de ces deux exercicesApproche est de faire le point sur leurscompétences acquises dans ces domaines. Ces exercices peuvent être donnés aux élèves àla maison; le travail en classe consiste alors àfaire le point sur les enjeux des graphiques et surle calcul des fréquences. Ils peuvent égalementêtre utilisés directement en activité de classe etfaciliter ainsi les échanges argumentés.Lecture de graphiqueNous avons choisi deux graphiques, parus dansla presse, illustrant des problèmes de sociétés,mais présentant des graduations trompeusesayant comme conséquence une exagération desvariations. Cet exercice a essentiellement deux objectifs:vérifier que les élèves savent réaliser desgraphiques;inciter les élèves à avoir un regard critiquesur l’information. ÉLÉMENTSDECORRIGÉa. Sur le premier graphique l’axe des abscissesn’est pas gradué régulièrement: il y a autant dedistance entre 1935 et 1938 qu’entre 1938 et1950! La croissance semble ainsi plus grandequ’en réalité!b.Sur le deuxième graphique, outre la graduationirrégulière de l’axe des abscisses, le fait que l’axedes ordonnées ne démarre pas à 0 donne uneimpression exagérée des variations!BIP %5202510150202529353850607081859095990003005200020051000100519001020304050607080902000Remarque:il s’agit, ici, de faire tracer, aux élèves,des graphiques «à la main». Population de référencedans le calcul de fréquencesCette Approche a également deux objectifsprincipaux:vérifier que les élèves savent calculer unefréquence exprimée en%;rappeler l’importance, dans le calcul d’unefréquence, de la population de référence. Cette Approche se prête également très bien àun travail sur tableur: ce peut être l’occasion defaire le point avec les élèves sur leursconnaissances «informatiques». Nous avonsd’ailleurs utilisé le tableur pour faire le corrigé.ÉLÉMENTSDECORRIGÉVoici une copie d’écran comportant une feuillede calcul permettant de répondre aux questionsposées. Noter la formule présente dans la cellulesélectionnée qui permet le calcul de la fréquencedes élèves de cette ville qui étudient l’espagnolen LV1.1 - Statistique 3
La lecture de ces tableaux permet de répondretrès simplement aux questions posées.1. a. 35,5% des élèves de Seconde de cette villeétudient l’allemand en LV1.b. 48,1% des élèves de Seconde de cette villeétudient l’anglais en LV1 et 16,4% l’espagnol.2. a. 36,65% des élèves du Lycée 1; 62,92% deceux du Lycée 2; 14,90% de ceux du Lycée3;31,21% de ceux du Lycée 4 et 37,5 de ceux duLycée 5 étudient l’allemand en LV1.b. Les colonnes Anglais et Espagnol du 2etableaudonnent les résultats attendus.Le diagramme en barres demandé ne présenteaucune difficulté: il suffit d’utiliser deuxcouleurs, l’une pour ceux qui étudient l’espagnolet l’autre pour ceux qui étudient l’anglais.3. Il est manifeste que les cinq lycées de cette villene se «ressemblent» pas pour ce qui est del’enseignement de la langue vivante 1: deuxd’entre eux ne proposent que l’allemand etl’anglais (l’un avec près des deux tiers des élèvesétudiant l’allemand et l’autre avec près des deuxtiers des élèves étudiant l’anglais); dans les troisautres lycées la répartition entre les différenteslangues n’est pas uniformemême si dans leLycée 4 cela n’en est pas très éloigné; en effetdans le Lycée 1 et le Lycée 3 la moitié des élèvesétudient l’anglais. Activités pour explorerLes trois activités proposées ici concernent unequestion intéressant les lycéens. Pour y répondre,il est nécessaire de recueillir des données et deles analyser.Les trois activités sont différentes dans leursapproches:la première nécessite la rédaction duquestionnaire et le recueil des données;dans la deuxième, les données sont lesrésultats de mesures faites par les élèves;dans la troisième, les données sontdisponibles et il suffit des les analyser pourrépondre aux questions.41 - StatistiqueACTIVITÉ1Comment les lycéensoccupent-ils leur temps?Réaliser un questionnaire n’est pas,contrairement à ce que l’on croit trop souvent,chose facile: il faut toujours penser àl’information que l’on souhaite obtenir, à ladifficulté de la recueillir (exhaustivité desmodalités, problèmes des choix multiples…) età son traitement futur. Il peut être intéressant,pour réaliser le questionnaire et sensibiliser lesélèves à ces difficultés, de leur demander depréparer quelques questions à la maison et, lorsde la mise en commun en classe, de les faireréfléchir aux conséquences de leurs choix. Il peutégalement être intéressant d’analyser quelquesquestionnaires; il en existe de nombreux plus oumoins bien faits permettant ce travail critique.Une fois le questionnaire réalisé, différentesstratégies pour le recueil des données sontpossibles:se contenter de la population composée desélèves de la classe; cela présente l’avantaged’être rapide;demander à chaque élève de la classed’interroger un certain nombre d’élèvesd’autres classes; se pose le problème dusérieux de la démarche;répartir l’ensemble des élèves en petitsgroupes de deux ou trois; chaque grouped’élèves ayant la charge d’une ou deux classesdu lycée; on pourra recueillir ainsi lesdonnées auprès de l’ensemble des classesdu lycée.ACTIVITÉ2Comparaison des tours de poignetsCette activité est très intéressante à mener enclasse: chaque élève de la classe mesure le tourde ses poignets et on recueille l’ensemble desrésultats. Il faut, bien sûr, prévoir suffisammentde ficelle pour que chaque élève puisse mesurerses poignets.Les principales difficultés, ici, sont la précisiondes mesures: à quel endroit mesure-t-on le tourdu poignet? et les imprécisions des mesures? Cela donne l’occasion de montrer aux élèves qu’ilfaut absolument définir un protocole précis pourminimiser les conséquences de ces problèmes.
Concernant les résultats, les auteurs ont souventconstaté que le tour du poignet droit estlégèrement plus grand que le gauche chez lesdroitiers; la différence (lorsqu’il est possiblede la faire) entre les garçons et les filles est assezsensible, mais la variabilité pour les individusde même sexe est plutôt relativement faible. Ilest possible d’utiliser ces questions pour évoqueravec les élèves le principe des tests statistiques;ici la question que se pose le statisticien est:«Les moyennes observées sont-elles vraimentdifférentes ou les différences observées sont-elles simplement dues aux fluctuationsd’échantillonnage?» Répondre à cette questionnécessite une modélisation probabiliste et laprise d’un risque accepté.ACTIVITÉ3L’obésité, un phénomène alarmant chez les jeunes FrançaisL’intérêt ici est de montrer comment on mesurel’obésité et de profiter de l’occasion pourrappeler comment Quételet a initié la statistiquesociale. On profitera de l’occasion pour montrerles enjeux de telles études, mais aussi leursdangers.Cet exercice se prête très bien à une utilisationdu tableur: il est possible de faire le point avecles élèves sur l’utilisation des formules utilisantdes variables déjà définies et sur la fonction Si (condition; valeur1; valeur2).ÉLÉMENTSDECORRIGÉ1.Dans ce Collège, 6 élèves sur 111 sont obèsesautrement dit 5,4% des élèves de Troisième dece Collège sont obèses: la situation est moinscatastrophique que celle annoncée dans lapresse.2.a. Il n’y a pas de différence notable entre lesclasses: il y a deux obèses en 3e1 et 3e2 et unseul en 3e3 et 3e4.b. Il semble cependant que le problème soitplus important chez les garçons: parmi les sixobèses, une seule fille; cinq garçons obèsesparmi les cinquante-quatre de ce Collège, celareste cependant encore en dessous du tauxannoncé dans la presse.Cours Nous avons voulu, dans le cours, insister sur ladémarche statistique; une fois la question poséeil faut: recueillir les données;traiter les données;interpréter les résultats pour apporter deséléments de réponse à la question posée.Nous avons choisi, pour illustrer le cours, dedérouler toujours le même exemple: celui ducontrôle de qualité dans une entreprisesidérurgique qui produit des poutres métalliquesappelées brames. Nous avons cependant utilisédans les pages de droite d’autres exemples issusde domaines différents, afin de montrer auxélèves l’étendue des domaines d’application dela statistique. Nous avons, autant que possible,présenté l’ensemble de l’étude: de la questionau compte-rendu. La rédaction d’un compterendu peut donner l’occasion d’une activité avecle professeur de français.Pour définir la médiane, nous supposons que lesdonnées xisont rangées; nous avons choisi dedéfinir la médiane comme étant «la» valeur nde Mqui minimise la distance xiM;si 1=inest impair (n=2k+1) la seule solution duproblème est xk+1; mais si nest pair (2k) il n’ya pas unicité de la solution (tout réel de [xk; xk+1] convenant): nous utilisons la conven-tion habituelle qui consiste à prendre le milieude cet intervalle.Remarque: dans tout ce chapitre (conformémentaux habitudes) nous avons omis le qualificatif«arithmétique» et lorsque nous écrivonsmoyenne, c’est de la moyenne arithmétique quenous parlons, c’est-à-dire de la valeur de mqui nminimise (xim)2. 1=iLe thème Moyennes (p.320 du manuel)illustre l’existence d’autres moyennes. Lors du calcul des fréquences (quotient deseffectifs par n), il est possible (en raison desarrondis) que la somme ne soit pas égale à 1;il est possible d’éviter cet inconvénient: calculerd’abord les fréquences cumulées (quotient deseffectifs cumulés par n), puis les fréquences, par1 - Statistique 5
soustraction. C’est ce qui explique que, danscertains énoncés, on demande d’abord le calculdes fréquences cumulées, puis celui desfréquences.Conformément au programme, nous n’avonspas abordé le problème de la simulation dansla partie Cours; par contre de nombreux Travauxdirigés et exercices y sont consacrés et doiventpermettre aux élèves de prendre conscience desproblèmes de modélisation des expériencesaléatoires (en ouverture vers les programmesde première) tout en illustrant le concept defluctuation d’échantillonnage.Problèmes résolus Nous avons voulu, à travers ce problème, mettreles élèves dans la situation dans laquelle setrouve le biologiste face à ces données: commentextraire l’information de ces valeurs? Lesquelques éléments de statistique descriptive auprogramme de Seconde permettent déjà demettre en évidence une propriété de ces données.C’est pourquoi certains auteurs préfèrentlexpression «statistique exploratoire» à«statistique descriptive»: en effet l’explorationdes longueurs des pinces des perce-oreilles apermis de déceler l’existence possible de deuxraces de perce-oreilles.Travaux DirigésApprendreEXERCICE1Données différentesrésumées en un mêmetableauLe but de cet exercice est de montrer aux élèvesque le rangement en classes est un résumé del’information et que la façon dont il est réaliséa des conséquences. Il est important de leurfaire remarquer que:lorsqu’une série ne contient que peu devaleurs (par exemple 12 comme ici) lerangement en classes ne sert à rien (fait iciuniquement pour illustrer facilement lesconséquences d’un rangement en classes);61 - Statistiquelorsque l’on range des données en classes,il faut adapter le nombre de classes auxnombres de données, éviter les classes vides,et il faut faire en sorte (autant que possible)que dans une classe les données soientuniformément réparties.ÉLÉMENTSDECORRIGÉa.La moyenne et la médiane de la série obtenueen prenant les centres des classes sont égales à 12.b.En réalité, dans le groupe 1, moyenne etmédiane sont égales à 10. Ces valeurs sontinférieures à celles obtenues en a.: tous lesindividus sont dans la partie gauche de leurclasse; il aurait été judicieux de choisir lesclasses: [4; 8[, [8; 12[ et [12; 16[.c.En réalité, dans le groupe 2, moyenne etmédiane sont égales à 13,5. Ces valeurs sontsupérieures à celles obtenues en a.: tous lesindividus sont dans la partie droite de leurclasse; il aurait été judicieux de choisir lesclasses: [8; 12[, [12; 16[ et [16; 20[.d.En réalité, dans le groupe 3, moyenne etmédiane sont égales à 11,5. Ces valeurs sontassez proches de celles obtenues en a.: ici lesindividus sont bien répartis dans leurs classes etle choix des classes est plutôt pertinent.e.En réalité, dans le groupe 4, la moyenne est10,67 et la médiane 10,75. La situation estquasiment la même que pour le groupe 1: ilaurait été plus judicieux de choisir les classes[f5.;L9es[ ,r [a9n;g 1e3m[e entt s[ 1e3n ;c l1a7s[s.es ne permettent pasd’obtenir les valeurs exactes de la moyenne et dela médiane; les valeurs obtenues en prenantles centres des classes sont plus ou moinséloignées de la réalité selon la façon dont lesclasses ont été réalisées. EXERCICE2Comparaison des salairesdans deux entreprisesLe but de cet exercice est de montrer que lamoyenne n’est qu’un indicateur parmi d’autreset que l’information qu’elle procure est unrésumé qui ne montre pas tout ; c’est pourquoiil faut, entre autres, lui associer un indicateur dedispersion. Cet exemple illustre ce que l’onappelle l’effet de structure.
ÉLÉMENTSDECORRIGÉ1.La seule difficulté dans la réalisation des deuxgraphiques est due au fait que les classes n’ontpas toutes la même largeur: dans unhistogramme c’est l’aire des rectangles, et nonla longueur, qui est proportionnelle aux effectifs.Entreprise E1%2,6537,1%6,7%10301,537,5%312,5%850%Entreprise E22. a. m1 =1 907et m2=2 156,ce qui sembledonner raison au PDG de l’entreprise 1.b. o1 =1 625et o2=1 583.c. c1 =4 417et c2=3 875; ceci montre quele PDG de l’entreprise 2 dit vrai.3.Les deux PDG disent la vérité: les salariés del’entreprise 2 sont en moyenne mieux payés queceux de l’entreprise 1, mais les ouvriers del’entreprise 1 sont en moyenne mieux payés queceux de l’entreprise 2, et il en est de même pourles cadres. Ce «paradoxe» s’explique facilementpar les structures très différentes de ces deuxentreprises: la proportion de cadres (25%) trèsforte dans l’entreprise 2 pousse le salaire moyende tous les salariés vers le haut et les cadres sont(dans les deux entreprises) en moyenne mieuxpayés que les ouvriers; les cadres de l’entreprise2, quoique moins bien payés que ceux del’entreprise 1, sont bien mieux payés que lesouvriers de l’entreprise 1. EXERCICE3Une valeur approchée de 12 Les élèves doivent utiliser leur double décimètrepour effectuer des mesures; ces mesures sontdonc entachées d’erreurs «inévitables»: ce sontles erreurs de mesure. Cet exercice a pour objectifde montrer que la moyenne présente l’avantagede «lisser» ces erreurs de mesure.Attention:la mesure de la longueur de ladiagonale de ces carrés est 512 et pour obtenirune valeur de 12 il ne faut pas oublier de diviserla moyenne finale par 5.Les observations individuelles sont déjà, engénéral, peu dispersées; la valeur approchéeobtenue avec les quatre valeurs est déjà de bonnequalité ; alors la valeur obtenue avec l’ensembledes élèves d’une classe est très «proche» (engénéral) de la valeur obtenue avec la calculatrice:1,414 213 562.Remarque:ce sont les problèmes de mesured’erreurs qui ont permis de mettre en évidencela loi de Laplace-Gauss (ou loi normale).EXERCICE4Résumé graphique d’un bilan trimestrielDans cet exercice, les élèves sont amenés à lireet à réaliser des graphiques très utiles mais plutôtinhabituels.ÉLÉMENTSDECORRIGÉa. L’observation des notes d’EPS, de musique etde français suffit à prouver que l’élève A estMathildeet l’élève C est Camille; l’élève B estdonc Paul. b. Il est possible d’initier les élèves à utiliser lafonctionnalité «radar» dans le tableur, mais ilest souhaitable que les élèves fassent cegraphique «à la main».SPELatin20MusiqueTechnologie15Franais10lectureSVT5Franais0criturePhysiqueFranaislaroMathHistoireDSMathGographieLV1LV1DMoralcritNotes de PaulRemarque:sur les deux graphiques donnés dansl’énoncé il y a aussi les moyennes de la classe(en rouge), qui ne sont pas sur le radar de Paul.EXERCICE5Tables de chiffres au hasard Cet exercice se prête très bien à une activitéd’une heure en classe, les élèves pouvant êtrerépartis en petits groupes (selon le modèle deleur calculatrice).Les objectifs de cet exercice sont:montrer ce qu’est une table de chiffres auhasard;1 - Statistique 7
vérifier que la distribution des chiffres d’unetelle table est quasi-uniforme;vérifier que le générateur de nombres pseudo-aléatoires d’une machine rend les mêmesservices;montrer qu’il est possible d’utiliser ces outilspour simuler des expériences aléatoires;illustrer les fluctuations d’échantillonnaged’une moyenne, d’une fréquence.ÉLÉMENTSDECORRIGÉ1. a.L’étude des cent premiers chiffres de latable (deux premières lignes) permet de dresserle tableau suivant.Chiffre0123456789Effectif10916915139667Fréquence0,100,090,160,090,150,130,090,060,060,07Il peut paraître surprenant, pour un élève,d’accepter l’hypothèse d’uniforme répartition. Ilfaut leur rappeler qu’un échantillon de taille100 est encore un peu petit. On peut leur signalerqu’ils auront l’occasion, dans le futur, detravailler avec des outils leur permettant d’allerau delà; à ce propos le test du Khi 2 ne permetpas, au risque de 5%, de rejeter l’hypothèsed’uniformité. b. L’étude des cent chiffres suivants permet dedresser le tableau ci-dessous.Chiffre0123456789Effectif1212776121213910Fréquence0,120,120,070,070,060,120,120,130,090,10Même remarque que pour les cent premierschiffres.Le cumul des deux tableaux précédents donnele tableau suivant.Chiffre0123456789Effectif22212316212521191517FréquenceLes fréquences sont plus «proches» de 0,1. 2. a. L’observation des chiffres de l’écran proposépermet de dresser le tableau.Chiffre0123456789Effectif3827584364Fréquence0,060,160,040,140,100,160,080,060,120,0881 - StatistiqueLes remarques faites précédemment restentvraies, d’autant plus que l’échantillon contientencore moins d’individus.b.Cumuler l’ensemble des résultats des élèvespermet de vérifier, qu’en principe, les fréquencessont plus proches de 0,1 lorsque la taille del’échantillon grandit.3. a.Il suffit de convenir qu’un chiffre pairdonne Pile (5 chiffres pairs sur 10 correspondbien à une fréquence de 0,5) et qu’un chiffreimpair donne Face.b.Il peut être intéressant de cumuler l’ensembledes résultats de élèves pour observer (en général)alors une fréquence de Pile «proche» de 0,5.EXERCICE6Combien de 6 en cent lancers de dé? Le but de cet exercice est de manipuler ungénérateur de nombres pseudo-aléatoires poursimuler une expérience et illustrer ainsi lesfluctuations d’échantillonnage d’une moyenne.Il est possible de proposer aux élèves de réaliserles expériences de la question 1.chez eux; lasuite de l’activité se fait alors en classe (enutilisant l’une des méthodes, selon sa propresensibilité…) avec un premier temps de mise encommun et d’analyse des résultas obtenus, suivide la mise en œuvre d’une des méthodes desimulation. L’auteur a utilisé le tableur pour simuler 30expériences (de 100 lancers de dés) et a obtenules résultats suivants.131424162019181616221217241417162116111713151612121119171324La moyenne de cette série est 16,5… àrapprocher de 16,667. Correction dans le manuel 2004 : à la question2.c. lire 16,7 au lieu de 5.EXERCICE7Simulation de lancers de piècesMêmes remarques que pour l’exercice 6.
rTavaux DirigésRechercherPROBLÈME1Loi de BendfordPour cet exercice, les élèves peuvent relever lesdonnées chez eux; la mise en commun et l’étudedes données se fait (relativement rapidement)en classe. ÉLÉMENTSDECORRIGÉLa distribution n’est pas uniforme et le 9n’apparaît pas le plus fréquemment, aucontraire: les fréquences sont (en général) unesuite décroissante; le 1 apparaît le plusfréquemment et le 9 le moins fréquemment. En 1881 l’astronome Newcomb, qui avaitobservé cette non uniformité à partir de l’usuredes tables de logarithmes, propose la formule log10(1 +1/k) comme fréquence d’apparition duchiffre k(voir le numéro 77 de Tangente «Faut-il se fier aux statistiques?»). Cette observation est valable quelle que soitl’unité utilisée : le changement de monnaien’altère pas la distribution.PROBLÈME2Les anniversaires L’auteur parie toutes les années dans ses classes(autour de 30 élèves) et le nombre de fois où ila perdu se compte sur les doigts d’une main.ÉLÉMENTSDECORRIGÉL’auteur a procédé à une simulation et sur centclasses il en a obtenu74 dans lesquelles il gagne.Le calcul (dont la compréhension est accessibleaux élèves de Seconde), si on souhaite leprésenter, se fait à partir de l’événementcontraire; pour une classe de nélèves, laprobabilité qnde perdre est donnée par laformule de récurrence qn+1=qn(365 – n)/365. La probabilité de gagner dépasse 0,5 dès qu’il ya plus de 23 élèves, et 0,9 avec 41 personnes;avec 32 élèves, on trouve une probabilité degagner égale à 0,79.PROBLÈME3Simulation du jeu de lotoLe résultat surprendsouvent: l’événementétudié se produit plus d’une fois sur deux! L’auteur a simulé 500 tirages et a obtenu291tirages comportant au moins deux numérosconsécutifs.Auto-test Questions Q1 Q2 Q3 Q4Bonnes réponsesVFVF FVFF FVFFVVVFQ1: Moyenne : m= 1(14 + 15 + 15 + 16 + 16 + 16 + 17 10+ 18 +18 + 19). m= 16,4.On peut préférer : m= 1(1 14 + 2 15 + 3 16 + 1 17 10+ 2 18 + 1 19).Mais l’écriture elle-même montre le peud’économie faite dans ce cas, et on notera queles méthodes modernes de calcul, par exempleutilisant les tableurs, n’amènent pas, dans uncas semblable, à utiliser des moyennespondérées.Médiane : la série comporte 10 éléments et elleest déjà rangée dans l’ordre croissant. La médianeest donc la moyenne des valeurs rangées en 5eet 6eplace, soit Med = 16.Mode : la valeur 16 est la plus représentée desvaleurs de la série. Cette série est doncunimodale et le mode est 16. Dans ce casparticulier, la série est donc égale au mode.Étendue : 19 – 14. L’étendue est donc égale à 5.Q2: Les données sont présentées de façongroupée. Pour le calcul de la moyenne,l’utilisation d’un moyenne pondérée s’impose.1m= (5 15 + 15 16 + 35 17 + 28 00118 + 11 19 + 6 20); m= 17,43 (jours).Médiane : La série comporte 100 éléments etelle est rangée, en classes, dans l’ordre croissant.La médiane est la moyenne des valeurs quiseraient rangées en 50eet 51eplace si l’on écrivaittoutes les valeurs en les répétant autant de foisque nécessaire. Le tableau montre que, dans ces conditions, la5evaleur serait 15, la 6eserait 16, la 20e(5 +15)serait 16, la 21eserait 17, et la 55e(5 + 15 + 35)1 - Statistique 9
serait 17. Les 50eet 51evaleurs sont donc toutesdeux 17.La médiane est donc 17 jours.La nombre de jours le plus fréquent est 17. Lemode est donc 17 jours.Q3: 20% des familles sont sans enfant. D’où laréponse Fà d.Q4: Les valeurs 10 et 90 sont évidemmentaberrantes. Une fois ces deux valeurs enlevées,on calcule la fréquence de la modalité 40 : f= 40= 4015 + 22 + 30 + 45 +40 +28 + 2182f= 0,219.À 0,01 près cette fréquence est donc égale à 0,22.Mais une valeur approchée à 0,01 près d’unnombre xest aussi une valeur approchée à 0,1de ce nombre. D’où la réponse Và b. Cela peutêtre une bonne occasion de réfléchir à la notionde valeur approchée.Moyenne : m= 15 36 + 22 37 + 30 38 + 45 39 + 40 40 + 28 41 + 2 42. 15 + 22 + 30 + 45 +40 + 28 + 2m= 7 081281Soit : m= 38,90.La médiane d’une série statistique n’est pasmodifiée si l’on supprime le même nombre devaleurs aux deux extrémités de la série.ExercicesAppliquer1a. La population concernée est l’en-semble des consommateurs français. b. L’échantillon étudié est l’ensemble des 1245personnes interrogées. c. Il n’est pas facile de décider de la représen-tativité de cet échantillon: pourquoi unique-ment les grands magasins? de quelles villes?… Il s’agit ici, uniquement, de sensibiliser les élèvesaux éventuels biais présents dans la constitutionde l’échantillon.2a. La population concernée par cetteétude est l’ensemble des Français.b. L’échantillon étudié est composé des 850Français extraits du fichier de recensement; lehasard garantit, ici, une certaine représentativité. 101 - Statistiquec. Les caractères étudiés sont le département(qualitatif), le nombre de personnes au foyer(quantitatif discret), le montant du revenuimposable (quantitatif continu), la catégoriesocio-professionnelle et le niveau d’études (tousles deux qualitatifs).3a. La population concernée par cetteétude est l’ensemble des pièces fabriquées lejour de l’étude.b.L’échantillon étudié est composé des 50 piècesprélevées. (Le hasard garantit, ici, une certainereprésentativité.)c. Les caractères étudiés sont la largeur, lalongueur, le poids d’une pièce (quantitatifscontinus), la présence ou non de défauts desurface (qualitatif à deux modalités).5(voir Tangente n°77)a. Chaque mois est représenté par un secteurangulaire de 30°: (360/12).b. On constate que le nombre de morts parmaladies évitables croît brutalement en juillet,puis un peu plus modérément en août, avant dedécroître jusqu’en octobre pour repartir de plusbelle jusqu’à atteindre un pic très important enjanvier 1885. c. Le nombre de morts suite aux blessuresmortelles n’a pas la même évolution: relativementfaible dans les premiers mois de la campagne(d’avril à octobre), il augmente de façon trèsimportante en novembre, avant de baisser endécembre, puis de remonter dès janvier 1885.6 .aIntervalle] 1 600; 2 000 ]] 2 000; 2 400 ]] 2 400; 2 800 ]] 2 800; 3 200 ]] 3 200; 3 600 ]] 3 600; 4 000 ]] 4 000; 4 400 ]Effectif5942630251Effectif cumulécroissant54183474999001
b.Poids des bébésEffectif03020101 6002 0002 4002 8003 200Poids (en g)Les deux exercices 7 et 8 ont le même objectif: faireune lecture critique de graphiques parus dans la presse.7a. La variable étudiée est l’âge. L’étudeconcerne les Français; on peut cependant noter,que dans le troisième graphique, il est fait allu-sion à l’Union Européenne. b. L’étude porte sur l’ensemble de la population.c. Les calculs nécessaires à la réalisation de cesgraphiques sont essentiellement des calculs defréquences.d. Ces graphiques sont des illustrationspermettant de comprendre la structure de lapopulation française (Doc. 1), l’évolution dela proportion des personnes de plus de 65 anset les évolutions comparées des proportions destrois catégories d’âge (Doc. 2). 8a. L’étude concerne le marché auto-mobile et son évolution dans le temps, en Franceet en Europe. Les variables étudiées sont lamarque et le modèle des voitures vendues.b. L’étude porte sur l’ensemble des voituresvendues.c. Le premier graphique (Doc. 1) est réalisédirectement à partir des donnéesbrutes; ilsuffit, pour les autres, de calculer des fréquences.d. Ces graphiques sont des illustrationspermettant de comparer l’évolution dans letemps des marchés français et européens(Doc.1) de visualiser le nombre de voituresfabriquées par les onze premiers constructeursmondiaux (Doc. 2) et de visualiser les parts demarché occupées par les dix modèles les plusvendus en France (Doc. 3).9Le diagramme en tige et feuilles est trèsutilisé dans les pays anglo-saxons; il présentel’avantage d’être facile à réaliser et permet devisualiser simplement les données.0414043910 8003833740 40633510 103410 203330 50 70 80 803200 10 10 20 30 50 60 70 80 90 90 903100 00 20 20 50 60 60 70 70 80 80 903000 00 10 40 50 70 70 80 902900 10 40 50 60 602810 10 20 20 40 60 80 80 2700 00 30 30 40 60 702600 10 20 40 50 50 60 802520 40 40 402400 00 10 40 60 80 902340 402210 4005122010 90019101811730 400661Les deux exercices 11 et 12 permettent de mettre enoeuvre les techniques de calcul vues en cours. Associésrespectivement aux exercices 6 et 10, ils permettentde faire le point sur tous les concepts de la statistiquedescriptive; il est possible d’utiliser l’un ou l’autreen devoir de contrôle.11a. L’étendue est 2 480 g (4 140 – 1 660 = 2 480).b. La médiane est 2 955 g (demi-somme du 50eet du 51e: (2 950 +2 960)/2).c. La somme des poids est donnée(290310g)et la moyenne estdonc 2 903,1 g.12a. Les garçons sont allés en moyenne1,75 fois au cinéma; les filles4,42 fois. Et lamoyenne pour l’ensemble des élèves de la classeest 2,75 (124,42 +201,75) /32)b. Le mode de la série est2. Sept élèves (2filleset 5 garçons) sont allés 2 fois au cinéma. Toutes1 - Statistique 11
Voir icon more
Alternate Text