15
pages
Français
Documents
1930
Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres
15
pages
Français
Documents
1930
Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres
A. Fessard
Henri Piéron
IV. Du minimum de mesures nécessaires pour l'étalonnage d'un
test dans un but psychométrique
In: L'année psychologique. 1930 vol. 31. pp. 246-259.
Citer ce document / Cite this document :
Fessard A., Piéron Henri. IV. Du minimum de mesures nécessaires pour l'étalonnage d'un test dans un but psychométrique. In:
L'année psychologique. 1930 vol. 31. pp. 246-259.
doi : 10.3406/psy.1930.30011
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1930_num_31_1_30011IV
DU MINIMUM DE MESURES NÉCESSAIRES POUR
L'ÉTALONNAGE D'UN TEST DANS UN BUT
PSYGHOMÉTRIQUE »
pav A. Fessard et H. Piéron
INTRODUCTION
Lorsqu'on cherche à déterminer une valeur numérique en employant
une certaine unité, on doit naturellement se demander la confiance
qu'on peut accorder à cette valeur. Dans ce but, la mesure doit être
répétée *.
Trois cas sont à envisager suivant la nature de ce que l'on mesure.
1er cas. — La mesure s'adresse à un objet considéré comme inva
riable, mesure d'une longueur physique, par exemple. Dans ce cas, les
différences des valeurs numériques obtenues au cours de mesures
successives sont envisagées comme des erreurs de mesure par rapport
à une valeur considérée exacte (la valeur moyenne par
exemple), les différences étant supposées obéir aux lois du hasard (et
la correction étant faite des erreurs systématiques, s'il y a lieu).
En Biologie, il peut sembler qu'il n'y a pas d'objet invariable, et
qu'on a toujours affaire à des processus évoluant dans le temps.
Toutefois, le produit de l'activité d'un être vivant peut constituer
un objet invariable, dont l'appréciation est susceptible de comporter
une valeur numérique ; et dès lors on se trouve dans le cas des erreurs
1. Rapport présenté à la 6 e conférence internationale de Psycho
technique à Barcelone (avril 1930).
2. t II ne suffit pas d'étudier la psychométrie de douze individus pour di
stinguer en eux ce qui appartient à la race et ce qui appartient aux variations
individuelles — disait Binet en 1895, rendant compte d'un travail sur le
temps de réaction et la race. — L'étude de ce cas particulier montre la nécess
ité de formuler des règles touchant le nombre d'expériences qu'il faut faire
pour rendre une conclusion certaine » (An. Ps., II, p. 769). Fessard et h. piéron. -tt wj unxiiiftw de mesures, etc. %b% à.
de mesures, si l'on faitfpar* exemple noter un dessin par une série de
juges (ou par le même|juge une série de fois, à condition qu'il n'y ait
pas d'influence des appréciations antérieures sur les appréciations
nouvelles, condition difficile à remplir, ce qui rend à peu près imposs
ible cette répétition).
Et d'autre part, même pour un processus qui évolue dans le temps,
si la mesure est effectuée simultanément et de façon indépendante par
une série de juges différents, les divergences des mesures individuelles
par rapport à la valeur considérée comme la plus vraie sont bien des
erreurs de mesure d'un objet pratiquement invariable, représentant
un morceau d'expérience dans des limites de temps définies, par
exemple si l'on note l'émotivité d'un sujet d'après sa réaction à un
stimulus impressionnant.
Il est possible que chaque juge soit affecté d'un coefficient d'erreur
systématique, mais on admet alors que les erreurs systématiques des
juges individuels se répartissent conformément aux lois du hasard et
peuvent être envisagées comme des erreurs fortuites. (Toutefois un
groupe de juges — comme un individu dans le cas de répétition des
mesures — peut être aussi affecté d'une erreur systématique, doat on
admettra alors qu'elle est connue et corrigée.)
2e cas. — La mesure s'adresse à un processus variable. Par exemple
on détermine la vitesse de réaction d'un individu (par la réciproque
de son retard de réaction à un stimulus donné). La répétition des
évaluations entraîne des divergences qui relèvent des modifications
survenues dans le temps. Les différences des mesures (supposées
exactes et suffisamment précises avec l'unité choisie) d'avec une
valeur considérée comme la plus vraie (par exemple la moyenne, là
encore) sont envisagées comme des variations, dont on suppose qu'elles
se repartissent conformément aux lois régissant les variations for
tuites (et une fois éliminées, s'il y en a, les variations attribuables à
un facteur défini, comme un allongement du retard de réaction par
une perturbation extérieure).
En ce qui concerne des tests dont on suppose qu'ils mesurent un
processus déterminé — plus ou moins complexe — la multiplic
ité des questions analogues ou la répétition des épreuves conduit à
envisager aussi des valeurs différentes susceptibles de variation.
3e cas. — On peut encore s'adresser à un groupe d'objets, à une
catégorie homogène dont on veut caractériser le type par une évalua
tion numérique. Chacune des mesures (supposées exactes, et pouvant
être elles-mêmes des moyennes, comportant une certaine erreur, une
certaine variation) présentera, par rapport à la valeur choisie comme la
plus vraie, comme la plus représentative du type (la valeur médiane,
par exemple) des divergences qui représe-nteront des écarts individuels,
dO|ût on .admet encore qu'ils se répartissent suivant une cqurbe voi
sine de la courbe normale de probabilité et peuvent être traités comme
fortuits, avec élimination des valeurs individuelles qui impliqueraient
U;n écart systématique, qu,i relèveraient d'objets hétérogènes, ne fai
sant p^as réeJjJement partie du même groupe. 248 NOTES ET BEVUES
Dans tous ces cas, on cherche à fournir la valeur la plus vraie, et
l'on se demande quelle confiance on peut accorder à cette valeur,
malgré les erreurs de mesure, les variations des processus, les écarts
individuels.
On sait que la confiance méritée par la valeur choisie est d'autant
plus grande que les divergences sont, dans l'ensemble, plus petites, et
que le nombre des mesures est plus grand. Or on ne dispose pas de la
grandeur des divergences, mais on peut disposer, en général, du
nombre des mesures.
Le problème se pose donc de déterminer le nombre de mesures à
effectuer, nombre minimum permettant de donner à la valeur numér
ique un poids suffisant, nombre maximum au delà duquel il y aurait
inutile gaspillage d'effort. Dans cet antagonisme entre le souci d'éc
onomie et le besoin de précision, l'équilibre dépendra des conditions particulier'
particulières de chaque cas, et en le nombre des mesures à
adopter dépendra de la grandeur des divergences.
Nous allons considérer d'abord les principes théoriques généraux
fondés sur des considérations statistiques, et ensuite les données expé
rimentales qu'il est possible d'invoquer, en matière d'étalonnage de
tests.
C'est au point de vue expérimental surtout que nous devrons envi
sager un cas très spécial, celui de la confiance à accorder, non plus à
une valeur représentative d'un groupe, mais au contraire à des valeurs
d'écarts, dans une répartition des fréquences de ceux-ci.
Au lieu de désigner un groupe — homogène au point de vue du ca
ractère mesuré — par une valeur significative du type recherché,
on évalue une certaine hétérogénéité qui intéresse, comme telle,
et l'on caractérise cette au moyen d'un repérage, par
exemple un décilage ou un centilage.
Quelle confiance mérite une valeur de décile ou de centile ? Ici
encore on peut se demander quel est le nombre minimum de mesures
nécessaires pour assurer un poids suffisant aux valeurs de répartition.
Ce cas implique un aspect différent du problème, théoriquement
plus complexe, pratiquement très important.
' I. POINT DE VUE THÉORIQUE
Appelons n le nombre d'éléments distincts envisagés. Suivant les
cas n représentera des sujets, des juges, des épreuves identiques ou
équivalentes, des portions analogues d'un même test. Des considéra
tions théorique