Statistique descriptive

icon

16

pages

icon

Français

icon

Documents

Écrit par

Publié par

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

16

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

18-1-2005
Statistique
descriptive
Nino Silverio
Support de cours provisoire pour
l’unité de valeur “Mathématiques
et statistiques” destiné aux classes
du BTS Comptabilité-Gestion de
l’ECG.
Introduction
STATISTIQUE La statistique est un ensemble de méthodes scientifiques basées sur le
recueil, l’organisation, la présentation de données, ainsi que sur la
modélisation et la construction de résumés numériques [3].
STATISTIQUE DESCRIPTIVE On parle de statistique descriptive lorsqu’on décrit et analyse des
données observées et qu’on tire des conclusions valables uniquement
pour l’ensemble étudié.
POPULATION On désigne par le mot population tout ensemble étudié par la
statistique ; on le note généralement Ω . On notera N le nombre
d’éléments de Ω , c’est-à-dire l’effectif total de la population (nous
supposerons toujours dans ce cours qu’une population est finie). Il faut
que la population soit définie avec précision ; ceci peut se faire de
deux manières :
• en extension, c’est-à-dire en dressant la liste explicite de tous les
membres de la population
• en compréhension, à l’aide d’une propriété caractéristique qui
permet de décider qui appartient ou non à la population.
Exemples :
• l’ensemble des étudiants du BTS de l’ECG
• les habitants domiciliés à Luxembourg-Ville
1 Introduction
ÉCHANTILLON Un échantillon désigne un sous-ensemble d’une population Ω .
UNITÉ STATISTIQUE, Une unité statistique, un individu ou un membre est un élément
INDIVIDU, MEMBRE ...
Voir icon arrow

Publié par

Nombre de lectures

227

Langue

Français

18-1-2005dSteastcisrtiipqtiuvee Nino SilverioSupport de cours provisoire pour l’unité de valeur “Mathématiques et statistiques” destiné aux classes du BTS Comptabilité-Gestion de l’ECG.IntroductionSTATISTIQUELa statistique est un ensemble de méthodes scientifiques basées sur le recueil, l’organisation, la présetnation de données, ainsi que sur la modélisation et la construction de résumés numériques [3].STATISTIQUE DESCRIPTIVEOn parle de statistique descriptive lorsqu’on décrit et analyse des données observées et qu’on tire desc onclusions valables uniquement pour l’ensemble étudié.POPULATIONOn désigne par le mot population tout ensemble étudié par la statistique ; on le note généralement . On notera N le nombre d’éléments de , c’est-à-dire l’effectif total de la population (nous supposerons toujours dans ce cours qu’une population est finie). Il faut que la population soit définie avec précision ; ceci peut se faire de deux manières :•en extension, c’est-à-dire en dressnat la liste explicite de tous les membres de la population•en compréhension, à l’aide d’u nperopriété caractéristique qui permet de décider qui appartient ou non à la population.Exemples : •l’ensemble des étudiants du BTS de l’ECG•les habitants domiciliés à Luxembourg-Ville1
ÉCHANTILLONUNITÉ STATISTIQUE, INDIVIDU, MEMBRECARACTÈRECARACTÈRE QUALITATIFCARACTÈRE QUANTITATIFSÉRIE STATISTIQUEDISTRIBUTION STATISTIQUEEFFECTIF D’UNE MODALITÉ2IntroductionUn échantillon désigne un sous-ensemble d’une population .Une unité statistique, un individu ou un membre est un élément constitutif d’une populaiton ou d’un échantillon.Toute propriété des individus d’une population est appelléec aractère des individus.Si le caractère étudié admet des valeurs ou modalités non mesurables, on dit que le caractère est qualitatif. Exemples :•la profession•le sexe•la nationalitéLorsque les modalités d’un caractèer sont mesurables, on dit que ce caractère est quantitatif. Exemples :•l’âge•la surface d’une habitation•la vitesse•la températureOn appelle série statistique une liste de N observations faites pour un caractère d’une population .Une série statistique ordonnée est appelée une distribution statistique.L’effectifn i d’une modalitéx i est égal au nombre d’individus de la population qui possèdent cette modalité xi. On a bien sûr :mN=n1+n2+...+nm=ni(1)=1iavec m étant le nombre de modalités possibles sur le caractère étudié.Exemple : voici une série statistique sur la nationalité des habitants du Grand-Duché de Luxembourg en 2001 (source : Statec)Statistique descriptive
FRÉQUENCEIntroductionEffectif 277.258.7192014.849.8439.5(x1000)On appelle fréquence d’une modalité xi d’effectif ni le rapport nfi=-i. En multipliant fi par 100, nous obtenons le pourcentage de Nla modalité xi.Exemple : pour la série statistique précédente, nous obtenonsEffectif 277.258.7192014.849.8439.5(x1000)Fréquence0.630.130.040.050.030.111Pourcentage63%13%4%5%3%11%100%La réalisation d’une série statistique peut vite devenir laborieuse. C’est pourquoi, de nos jours, il ets préférable d’utiliser un outil informatique, comme un tableur(1).Nous constatons que la somme des fréquences vaut 1. Ceci n’est pas un hasard, en effet :1.En fait, bien que nous puissions utiliser n’importe quel tableur ,dans le cadre de ce cours nous travaillons avec Excel.Statistique descriptive3
GRERPARPÉHISQEUNETSATIONS DIAGRAMME EN BÂTONSDIAGRAMME EN BARRES4Introductionmmn1m1fi=---i=--N-ni=--N-N=1Ni=1i=1i=1Il est souvent préférable de représenter graphiquement une série statistique. Un graphique permet d’avoir une vue d’ensemble, synthétique de toutes les données mesurées. Ceci est d’autant plus facile si on utilise l’outil informatique.En Excel, ce type de diagramme est une variation du “Chart typ e: line”.La largeur de la base des barres est identique pour toutes les barres, la base chacun des rectangles étant centrée sur les points représentés sur l’axe des abscisses.Statistique descriptive
BDIAANGDREAAMUMXE EN SDIEACGTREAUMRSME EN EFFECTIFS CUMULÉS CROISSANTS, DÉCROISSANTSIntroductionCe diagramme est semblable à un diagramme en barres, sauf que les effectifs sont placés sur l’axe des abscisses.Chaque secteur représente une modalité et la taille de chaque secteur est proportionnelle à l’effectif( fréquence) de la modalité.Dans la pratique, lorsqu’on este n présence d’une distribution statistique, il est souvent intéressant de connaître le nombre de valeurs inférieures ou égales à une modalité xi. Il en est de même pour le nombre de valeurs supérieures ou égales à une modalité xi.À cet effet, on calcule l’effectif cumulé croissant :in1+n2+...+ni=nk(2)=1kStatistique descriptive5
FRÉQUENCES CUMULÉES CROISSANTES, DÉCROISSANTES6Introductionou l’effectif cumulé décroissan t:–1iN–(n1+n2+...+ni–1)=N–nk(3)=1kD’une manière tout à fait semblabel, on peut calculer la fréquence cumulée croissante de la valeur xi de la distribution statistique X :if1+f2+...+fi=fk(4)=1kCette somme désigne la proportion d’individus dans la population  pour lesquels X prend une valeur inférieure ou égale à xi.Si on s’intéresse à la proportiond ’individus dans la population  pour lesquels X prend une valeur supérieure ou égale à xi, on calcule la fréquence cumulée décroissante :–1i(f1+f2+...+fi–1)=1–fk(5)=1kExemple : voici une série statistique sur la composition des ménages au Luxembourg en 1991.Dans cette liste Excel, seules les colonnes A et B contiennent les données fournies par le Statec.Les colonnes C à G résultent de calculs en appliquant les formules vues plus haut.Statistique descriptive
IntroductionÀ partir de ces données, on peut produire différents graphiques. Voici par exemple un diagramme en barres renseignant sur la composition des ménages privés selon le nombre de personnes en 1991 au Grand-Duché de Luxembourg (source Statec).Mais on peut aussi faire un graphique représentant les effectifs cumulés croissants et décroissants :De même, nous pouvons faire un diagramme en barres sur les fréquences cumulées croissantes et décroissantes :Statistique descriptive7
CLASSE8Groupement de données en classesGroupement de données en classesDans la pratique, il est très fréquent pour une série statistique (en présence d’un grand nombre de vlaeurs) de regrouper des valeurs proches les unes des autres. On appelle un tel groupement de données une catégorie ou une classe.Pour une classe ]ai–1,ai] ou [ai–1,ai[  :•ai–1 et ai sont les bornes ou limites de la classe+aa•le centre de la classe vaut i–1--i2•l’amplitud eou l’étendu ede la classe vaut ai–ai–1•l’effectif de la classen i est égal à la somme des effectifs des valeurs de la série statistique appartenant à la classe.Statistique descriptive
HEIFSFTEOCGTIRFASMME DES LE MODELA MOYENNE ARITHMÉTIQUELA MOYENNE ARITHMÉTIQUE SIMPLELA MÉDIANELes paramètres de positionIl n’existe pas de règle claire quan tau choix du nombre de classes. Il existe quelques règles simples qu’on essaiera de suivr e:•l’effectif d’une classe ndeo it pas être inférieur à cinq•le nombre de classes ne doit pas être trop faible•il existe quelques formules empiriques pour déterminer le nombre de classes c, par exemple : c=N, c=(1+3,3log10N)•en général, nous essaierons d’avoir des classse de même amplitude qui sera de préférence une valeur simple comme un entier.Pour représenter de telles séries, on utilise souvent l’histogramme des effectifs. Il s’agit d’un diagramme ebna rres comprenant une barre pour chaque classe et où la surface de la barre est proportionnelle à l’effectif de la classe.Les paramètres de positionOn appelle mode d’une série statistique la modalité la plus fréquente. Il peut ne pas exister et n’est pas nécessairement unique.La moyenne arithmétique d’une série statistique quantitative vau t:mx=n1x1+n-2x2+...-+nmxm-=--1-nx(6)iin1+n2+...+nmNi=1Cette formule se simplifie si ni=1 pour i=1m. En effet alorsmximx=1x1+1-x2+...-+1xm-=i=1-=--1-x(7)i1+1+...+1mmi=11=1iLa médiane d’une série statistique rnagée en ordre croissant ou décroissant est une valeur qui partage en deux parties égales l’effectif total de cette série. Si l’effectif est un nombr epair, on prendra comme valeur médiane la moyenne arithmétique des deux valeurs centrales.Statistique descriptive9
ÉTENDUEVARIANCEÉCART-TYPE01Les paramètres de dispersionExemple : soit la série statistique suivante 5366162171La moyenne arithmétique vaut 3.8, les modes sont 1 et 6, la médiane est égale à (3+5-)=4.2Dans le cas d’une séries tatistique numérique classée, on peut calculer une valeur approchée de la moyenne en prenant pour xi les centres de classe, pour ni les effectifs de classe et m égal au nombre de classes.Les paramètres de dispersionOn appelle étendue d’une série statistique l adifférence entre les deux valeurs extrêmes de la série.La variance d’une série statistique qauntitative est la moyenne arithmétique des carrés des écarts à la moyenne arithmétique. On la 2note généralement σ.m122σ=m-(xi–x)(8)=1iécart-type est définie comme étant la racine carrée positive de la variance. L’avantage de l’écart-ty ppear rapport à la variance est que c’est un nombre qui s’exprime danlsa même unité que les valeurs observées.m12σ=-m--(xi–x)(9)=1iLa signification de l’écart-typee t de la variance est simple : plus les valeurs observées sont homogènes, plus ces deux nombres sont petits et inversement, plus les valeurs sont hétérogènes, plus ces deux nombres sont grands.En général, la formule de la variance s’écritStatistique descriptive
Les paramètres de dispersionet l’écart-typemσ2=--1-ni(xi–x)2N=1i)01(mσ=1-ni(xi–x)2(11)N=1iEn présence d’une série statistique numérique classée, on peut calculer une valeur approchée de l’écart-type et de lav ariance en prenant pour xi les centres de classe, pour ni les effectifs de classe et m égal au nombre de classes.Pour les calculs pratiques, ces formules peuvent être simplifiées :mmAinsi σ2=--1-(xi–x)2=--1-(xi2–2xix+x2)mi=1mi=1et la variance peut s’écrire1m21m21m222---xi–2x---xi+x=-xi–2x+x en utilisant (7)mi=1mi=1ni=1mσ2=--1-x2–x2=x2–x2mi=1imDans le cas général : σ2=-1--ni(xi–x)2N=1im122=--N-ni(xi–2xix+x)=1i1m2m2m=---nixi–2xnixi+xniNi=1i=1i=1Statistique descriptive)21(11
Voir icon more
Alternate Text