23
pages
Français
Documents
1978
Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus
Découvre YouScribe et accède à tout notre catalogue !
Découvre YouScribe et accède à tout notre catalogue !
23
pages
Français
Documents
1978
Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus
Publié par
Publié le
01 janvier 1978
Nombre de lectures
27
Langue
Français
Poids de l'ouvrage
3 Mo
Publié par
Publié le
01 janvier 1978
Langue
Français
Poids de l'ouvrage
3 Mo
Monsieur Michel Volle
L'analyse des données
In: Economie et statistique, N°96, Janvier 1978. pp. 3-23.
Citer ce document / Cite this document :
Volle Michel. L'analyse des données. In: Economie et statistique, N°96, Janvier 1978. pp. 3-23.
doi : 10.3406/estat.1978.3094
http://www.persee.fr/web/revues/home/prescript/article/estat_0336-1454_1978_num_96_1_3094Resumen
El análisis de los datos - Con el desarrollo de los medios informáticos se iniciè la elaboración de nuevos
instrumentes de estadística descriptiva los que permiten, no solo desprender « significados » entre
esos montones de datos, sino mas pronto llevar a cabo una sintésis de los resultados. El análisis de los
datos facilita por tanto un apreciable aporte a la publicación que ha de seguir a las fases metodológicas
y téenicas propias de todo estudio estadístico. Este artículo, concebido a modo de artículo de
referencia, delinea con grandes rasgos las principales características de los métodos mas corrientes
del análisis factorial y de la clasificación automática ya que ambas ramas son complementarias. El
autor pormenorizó las que, a su parecer, eran las más fundamentales, o sea el análisis factorial de las
correspondencias y la clasificación según varianza. Dá para cada una de ellas una aplicación que
abarca la distribución de la población por grupos de edades en las 22 regiones francesas. A
continuación iran resenados en forma sucinta los demás métodos.
Résumé
Avec le développement des moyens informatiques vint l'élaboration de nouveaux instruments de
statistique descriptive permettant non pas de dégager des « significations » parmi ces masses
d'information mais plutôt une synthèse des résultats. L'analyse des données apporte donc une
contribution appréciable à la publication qui doit suivre les phases méthodologiques et techniques
propres à toute étude statistique. Cet article, conçu en tant qu'article de référence, brosse à traits
rapides les principales caractéristiques des méthodes les plus courantes de l'analyse factorielle et de la
classification automatique, ces deux branches étant complémentaires. L'auteur a détaillé celles qui lui
paraissaient les plus fondamentales : l'analyse factorielle des correspondances et la classification selon
la variance. Il donne pour chacune d'elles une application portant sur la répartition de la population par
classe d'âges dans les 22 régions françaises. Ensuite, les autres méthodes seront décrites de façon
succincte.
Abstract
Data Analysis -With the developpment of computer methods has come the elaboration of new
descriptive statistical tools. These allow not just the retrieval of « significant » data in the mass of
information, but also they permit a synthesis of results. Data analysis contributes appreciably to the
publication of the results that ought to follow the technical and methodological stages proper to every
statistical study. This article is a reference article which attempts to sketch out rapidly the principal
characteristics of the most current « factor analysis » and automatic classification methods. These two
branches are complementary. The author has treated in detail the methods which he considers to be
the most fundamental : factor analysis of correspondances and the classification according to variance.
He presents for each of these an applied studies using the divisions of the population according to age
in 22 regions of France. Finally, the other methods are described in a succinct fashion.L'anal/se des données
par Michel VOLLE *
L'analyse des données est de plus en plus utilisée par les statisticiens français : d'ailleurs, ce numéro
d'Économie et statistique contient deux exemples d'utilisation de cette méthode. Il est Vraisemblable
que nous serons conduits, dans des numéros futurs, à en publier d'autres. C'est pourquoi il nous a paru
nécessaire de présenter ici une description de l'analyse des données qui, sous une forme à la fois assez
générale et aussi claire que possible, permette à nos lecteurs de disposer des éléments d'information
essentiels. La référence à cet article général permettra d'éviter de répéter pour chaque application la
description de ces méthodes.
L'analyse des données est actuellement, chez les statisti La place de l'analyse ciens, l'objet d'un véritable phénomène de mode, caractérisé
à la fois par l'engouement et le rejet. A première vue, les des données réactions souvent extrêmes à propos de cette nouvelle
méthode surprennent, car elle ne fait que systématiser les dans la pratique statistique
démarches de la statistique descriptive; et cette spécialité
modeste n'avait guère retenu l'attention des théoriciens ni L'appellation d' « analyse des données » recouvre une provoqué de controverses depuis sa naissance. collection d'instruments de descriptive. Collec
Cependant, quand on y regarde d'un peu près, on voit tion, c'est-à-dire rassemblement et juxtaposition dont le
qu'il faut, pour situer et délimiter la place de l'analyse des lien logique est parfois ténu. Instruments, c'est-à-dire outils
données, étudier de façon assez approfondie les étapes du dont on attend d'abord qu'ils aient une efficacité pratique,
travail statistique; et cette étude conduit à poser des la justification théorique éventuelle n'étant recherchée
questions qui sans doute ne sont pas nouvelles, mais qui qu'en second. Statistique descriptive, c'est-à-dire que
avaient peut-être été un peu oubliées depuis les débats l'analyse des données s'applique à des résultats statistiques
auxquels la statistique donna lieu au XIX* siècle lors de sa bruts, dont elle vise à faciliter le maniement : elle se situe
formation en tant que discipline. La nature même de ces immédiatement en aval de la production de ces résultats,
questions permet de comprendre l'âpreté de certaines et en amont de leur présentation littéraire
discussions et l'insuffisance des explications en termes de qu'elle prépare, des raisonnements probabilistes (notam
« résistance au changement » ou de « conflits de chapelle » ment économétriques) que l'on peut effectuer sur eux et des
que l'on en donne parfois. études proprement économiques, sociologiques ou autres
qu'ils peuvent nourrir. Nous commencerons donc cet article en situant l'analyse
des données dans la pratique du travail statistique. Nous
entrerons ensuite dans la description de ses instruments Une collection d'instruments
en nous attachant à dégager leur idée directrice plutôt
de statistique descriptive qu'à donner une formulation mathématique complète.
Ce panorama, qui ne prétend pas se placer sur le même plan Les outils traditionnels de la statistique descriptive, ces que les traités spécialisés, donnera sur les apports de l'ana premières ébauches de l'analyse des données (histogrammes lyse des données des indications qui, nous l'espérons, et graphiques divers, calculs de moyennes et de dispersions, aideront à clarifier le débat. etc.), sont à la fois d'une grande utilité pratique et, à première
Quelques points de repère mathématiques sont fournis
dans les « encadrés »; ils précisent le contenu du texte,
mais leur lecture n'est pas indispensable pour le comprendre. Michel Voile fait partie de l'Unité Recherche de l'INSEE.
ANALYSE DES DONNÉES
8 671003 5 66 2 ÉLÉMENTS HISTORIQUES
• Sur l'analyse factorielle : C'est au début du siècle que les J.-B. Kruskal, R.-N. Shepard, W. S. Torgerson, G. Young, etc. Sous
le nom de « multidimensional scaling », ces auteurs proposent des psychologues cherchent, derrière les notes obtenues par des sujets
techniques de représentation de tableaux essentiellement issues à de nombreux tests, une variable explicative cachée : le facteur
d'observations ou d'expériences psychologiques (mesures de similargénéral d'aptitude (travaux de Charles Spearman en 1904). Ils cher
cheront ensuite deux, puis plusieurs facteurs (mémoire, intelligence, ités, tableaux de préférences ou de dominances) par des techniques
etc.) non observables directement, mais susceptibles d'expliquer, robustes, c'est-à-dire peu hypothéquées par des a priori.
au sens statistique du terme, les nombreuses notes obtenues par les
sujets (travaux de Cyrill Burt, L L Thurstone). Il s'agit bien, ici, • Su