Journ@l Electronique d ’ H i s t o i r e d e s P r o b a b i l i t é s et de la S t a t i s t i q u e Electronic Journ@l for H i s t o r y of P r o b a b i l i t y and S t a t i s t i c s Vol 4, n°2; Décembre/ December 2 0 0 8 www.jehps.net HistoireetPr éhistoiredel'Analysedesdonn ées par 1J.P.Benzecri:uncasdeg én éalogier étrospective 2MichelARMATTE Dans les a nnées1970, L' école d'analyse des données " àla fra nçaise" – AD dans ce qui suit - est en plein développement. Elle fait m ême l'objet "d'un v éritable phénom ène de mode chez les statisticiens, caract éris é à la fois par l'engouement et le rejet" selon M. Volle (1980). Nous en rappelons d'abord les grands moments. Elle a ét é impuls ée par le professeur Jean-Paul Benz écri, normalien et 3 él ève de Cartan , Ma ître de conf érence à l'Universit é de Rennes depuis 1960 . Son travail à Rennes centr é sur une approche inductive de la linguistique par l'analyse de tables de distributions de mots (dans la li gnée des travaux de Z.S. Harris, oppos ée à celle de Chomsky), forme dès 1962 le cadre de l'invention de l'analyse des correspondances comme m éthode d'analyse factorielle de tableaux 2de contingence munis d'une m étrique du χ impos ée par le principe d' équivalence distributionnelle. Un expos é au Coll ège de France début 1963 est e l'occasion une premi ère synt hèse de ses r ésultats, et la t hèse (de 3 cycle) de Brigitte Cordier pr ésent ée le 6 mai 1965 conforte les principales démonstrations mat hématiques ...
Journ@l Electronique d ’ H i s t o i r e d e s
P r o b a b i l i t é s et de la S t a t i s t i q u e
Electronic Journ@l for H i s t o r y of
P r o b a b i l i t y and S t a t i s t i c s
Vol 4, n°2; Décembre/ December 2 0 0 8
www.jehps.net
HistoireetPr éhistoiredel'Analysedesdonn ées par
1J.P.Benzecri:uncasdeg én éalogier étrospective
2MichelARMATTE
Dans les a nnées1970, L' école d'analyse des données " àla fra nçaise" – AD
dans ce qui suit - est en plein développement. Elle fait m ême l'objet "d'un
v éritable phénom ène de mode chez les statisticiens, caract éris é à la fois par
l'engouement et le rejet" selon M. Volle (1980). Nous en rappelons d'abord les
grands moments.
Elle a ét é impuls ée par le professeur Jean-Paul Benz écri, normalien et
3
él ève de Cartan , Ma ître de conf érence à l'Universit é de Rennes depuis 1960 .
Son travail à Rennes centr é sur une approche inductive de la linguistique par
l'analyse de tables de distributions de mots (dans la li gnée des travaux de Z.S.
Harris, oppos ée à celle de Chomsky), forme dès 1962 le cadre de l'invention de
l'analyse des correspondances comme m éthode d'analyse factorielle de tableaux
2de contingence munis d'une m étrique du χ impos ée par le principe
d' équivalence distributionnelle. Un expos é au Coll ège de France début 1963 est
e
l'occasion une premi ère synt hèse de ses r ésultats, et la t hèse (de 3 cycle) de
Brigitte Cordier pr ésent ée le 6 mai 1965 conforte les principales démonstrations
mat hématiques de cette approche, établit le principe de dualit é qui permet la
repr ésentation simulta née des deux ensembles en correspondance, et surtout,
traite pour la premi ère fois un exemple complet sur un IBM 1620.
1 Je remercie Ludovic Lebart et Pierre Cazes pour leur relecture attentive de ce texte. Je d édie ce texte à
la m émoire de Henry Rouanet, d éc éd é le mois dernier, qui fut une r éf érence de la Statistique math ématique et de
l'Analyse des Donn ées et un grand admirateur critique de l' œuvre de Benz écri. Il a plus que largement contribu é
à la diffusion de ce qu'il appelait l'approche g éom étrico formelle de l'analyse des donn ées multidimensionnelles,
en France(voir Rouanet et Le Roux 1993)et aux Etats-Unis (voir Rouanet2004)avec la pr éface de P. Suppes.
2
Universit é ParisDauphine et Centre A.Koyr é. michel.armatte@dauphine.fr
3 avecqui il afaitune th èse de topologie(1955)
1Benz écri, nomm é Professeur à la Facult é des Sciences de Paris
(Sorbonne) est alors accueilli par le professeur D ugué, Directeur de l'ISUP et le
doyen Zamanski dans le nouveau laboratoire de statistique mat hématique de la
Facult é des Sciences de Paris. Il y fait d'abord un cours d'option avant d'en
prendre la Direction en 1967. La chaire et le laboratoire associ é ont ét é le cadre
essentiel de l' élaboration et de la diffusion de cette analyse des d onnées à la
fra nçaise. Ses él éments ont ét é établis à l'occasion des cours de DEA de 1965-
66, et 1967-68, enrichis par la t hèse de Maurice Roux (1968) sur la classification
de données écologiques. En janvier 1968, Ch. Masson lit au colloque d'Honolulu
consacr é à la reconnaissance des formes un rapport de Benz écri, publi é l'a nnée
suivante, qui peut être consi dér é comme la premi ère synt hèse en anglais de ses
travaux.
Cette m ême a nnée 1968 est bien évidemment marq uée par les
é vénements de mai. L'innovation principale est que les stages de DEA,
introduits dès 1966 vont se substituer partiellement aux enseignements
suspendus (ainsi que toute l'activit é du laboratoire) et devenir obligatoires.
Benz écri pr ésente cela comme une reprise de sa proposition et comme une
r éponse à la critique d'une Universit é scl éros ée, mais je me souviens aussi qu'ils
furent la solution d'un contr ôle des connaissances interrompu par les é vénements
du Quartier Latin. L'examen fut repouss é en septembre et compl ét é par une note
4de rapport de stage . En tout cas ces stages dans les laboratoires du CNRS, de
l'Universit é, ou des grandes entreprises nationalis ées, ont ét é une source
ininterrompue de don nées et de probl èmes pos és au Laboratoire, stimulant la
recherche qui y était faite. Mais ils ont ét é aussi un puissant vecteur de sa
diffusion dans les domaines les plus vari és, débouchant souvent sur des emplois
et en tout cas sur des r éseaux de collaboration anim és par des anciens él èves se
vivant comme des missionnaires de l'AD.
En 67-68, l'effectif des étudiants de DEA est déj à de 94 inscrits, il est
quelques a nnées plus tard, dans les a nnées 1972-76 de l'ordre de 180 à 200. La
m éthode a acquis une stabilit é mat hématique et commence à diffuser dans les
diff érents milieux de la recherche, toutes disciplines de l'homme et de la nature
confondues, par le jeu conj ugué de l'ordinateur et des bataillons de jeunes
5 6
statisticiens e nvoyés en stage de DEA dans leurs laboratoires . Pierre Cazes qui
4
Les n égociations entre les étudiants et Benz écri ont ét é men ées par Michel de Virville, d él égu é des
étudiants au conseil de gestion du laboratoire, et L'AG du 10 juin 1968 a d écid é que l'admission se ferait sur la
base d'un compte-rendu de stage ou de tout autre travail statistique. Mais le rapport de force ayant un peu chang é
dansl' ét é,un examen deseptembre eu lieu en compl ément.
5
C'est une strat égie explicite de Benz écri : "Or pour analyser il fallait des donn ées. ..je r ésolus
d'envoyer les étudiants du DEA cueillir des gerbes de ces pr écieuses fleurs. D ès mon cours j'annon çai qu'ils
devaient faire des stages pratiques . Mais cet appel r ép ét é de semaine en semaine ne trouvait pas d' écho ( …) Le
joli mois de mai allait tout changer!" (Benz écri 2008). Benz écri lui-m ême (HPAD et R éponse à Rouanet et
L épine 1976) reconna ît que ces él èves mal aguerris lanc és dans la nature avec les premiers programmes d'AD
sur ordinateurs ont men és une guerre de conqu ête qui n'a pas ét é sans d ég âts collat éraux : "A partir de 1965, des
2assure alors en tandem avec Benz écri la gestion de ces stages. confirme que
cette gestion était facilit ée par le fait que les offres de stages et les demandes de
traitement de données affluaient au laboratoire, et que Benz écri en traitait
personnellement un grand nombre. Dans le prolongement de ces stages, les
t hèses se font de