Sommaire

Table des matières

4. Approche psychométrique
  4.1. Vers le test.
  4.2. La psychométrie.
 
4.3. Quel test et pourquoi ?
  4.4. Les  Wechsler
  4.5. L'anamnèse.
  4.6. La passation du test.
  4.7. L'analyse des résultats.
        Mode de calcul.
        QIT : représentation ?
        Quel seuil ?
        IAG ou QIT
        Profil des notes std
        Représentation graph.

        Profil parfait ?
        Chronosensibilité
        Endurance
        Optionnels
      Observations
 
4.8. Leur restitution
  4.9 Les inventaires



Notes



















(1) J. Lautrey,
in L'état de la recherche sur les enfants dits « surdoués »  Introduction. Fondation de France/CNRS. Lien.





(2) 
Selon les études de Grégoire, Liratni, Lautrey, Pereira-Fradin.
Voir : Sources.






(3) Selon les études de M. Liratni (LIR), M. Pereira-Fradin (PER) et Manuel  du WISC IV. Les critères de sélection sont de QIT130 pour les au- très études et QIT et/ou Indi- ces à 125 pour la nôtre).
Voir : Sources.
















(4) J. Grégoire in Les Indices du WISC-IV et leur interpré- tation. Le Journal des psycho- logues 2007/10.
J. Lautrey et alt,  in L'état de la recherche sur les enfants dits « surdoués ». CNRS, Univ. Paris V. Fondation de France. 2004.



























































































































































































































4. Surdouement : Approche psychométrique

4.7. L'analyse des résultats


Elle est complexe, car les résultats comportent plusieurs séries de chiffres qui s'articulent selon différents modes de calcul qu'il est important de bien comprendre pour éviter les mauvaises interprétations.


 4.7.1. Les modes de calcul

Dénomination Modes de calcul
Notes brutes Sur « n » questions de difficulté croissante, c'est le nombre de réponses justes obtenues. Elles sont cotées : 0, 1 ou 2 selon la qualité de la réponse (fausse, approchante, complète). Le nombre de questions est variables selon les sub-tests. On arrête les questions après un nombre variable d'échecs successifs selon les épreuves .
Notes standard Comptabiliser 10 bonnes réponses à 10 ans montre un niveau supérieur au même score à 15 ans, en terme de précocité de développement. La note brute est donc ramenée à une table statistique en fonction de l'âge, par tranche de 3 mois pour le WISC IV ou V. Elles sont plafonnées en général à 19, sauf : Cubes, MdC, IdC et Matrices qui, descendront à partir de 13 ans et finiront à 16 ans 8 mois, respectivement à 17, 17, 15 et 17.
Indices Ils sont différents selon les versions en nombre et en composition (voir : 4.4  Psychométrie). Ils regroupent les subtests d'un même registre. Ils se calculent sur la somme des notes standard du registre considéré, ramenée à une table statistique. Ainsi, un point de cette somme peut valoir 1 ou parfois plusieurs points en Indices. Les indices sont plafonnés à 155 (ICV, IRP) ou à 150 (IMT, IVT).
QIT Le QIT se calcule sur la somme des 10 notes standard, sauf sur 7 pour le WISC V. Ces notes  sont ramenées à une table statistique. Il est plafonné à 160.
       Le QIT n'est donc pas la moyenne arithmétique des Indices, mais désigne, comme les Indices, le rang du sujet  dans la population d'étalonnage.


 4.7.2. Le QIT ou QI Total

Le QI Total (QIT) est censé donner une représentation globale des capacités de la personne testée. Il varie sur l'échelle de Wechsler de 40 à 160 points avec, par construction, une moyenne à 100 points. Toujours par construction, l'écart-type est situé à 15 points. Un QIT de 100 correspond à 50% de la population et le QIT moyen théorique s'échelonne, selon les auteurs, de 90 à 110 (68,26% de la population) ou de 85 à 115 points (1 écart-type). La distribution suit par construction une courbe de Gauss :


Graphique 1


C'est à partir de cette courbe que se déterminent les différentes catégories, notamment pour la discrimination de la déficience ou du surdouement intellectuel. La plupart des institutions ou des associations s'étaient basées sur un QIT 130 (2,27%), soit à deux écarts-type de la moyenne, pour la détermination du surdouement. Terrassier tenait pour un QIT à 125 (4,78%). Ces seuils avaient le mérite de la simplicité, mais avec comme corollaire : à 130 (125) on est surdoué et à 129 (124) on ne l'est pas. Or, la courbe est progressive et ne fonctionne pas par saut qualitatif. C'était prendre le QIT pour un couperet de concours, alors qu'il est avant tout un outil de compréhension de la personne. Jacques Lautrey (1)  avait mis en garde contre cette "religion" du 130


 4.7.3. QIT et Indices comme représentations globales des capacités ?

Le QIT est censé donné une représentation globale des  capacités d'un sujet. Mais, la précision des échelles de Wechsler, comme pour tous les autres tests, est meilleure au centre de la courbe qu'aux extrêmes.
      Les personnes surdouées, se trouvant aux extrêmes, réagissent donc différemment. Par exemple, le QIT n'est valide que si l'empan entre les indices ne dépasse pas 15 points (1 écart-type). Or, nos études Wi4n120, Wi5n70 et Wa4n62, conformes en cela aux autres études (2), montrent que seuls 3 à 6 % seulement des QIT ne dépassent pas le seuil des 15 pts, donc pour l'ultra-majorité des HP, le QIT ne devrait pas être calculé et ne pas être interprété comme représentation globale des capacités  d'un sujet HP.
Test
QIT valide
Wi4n120
5%
Wi5n70
5,71%
Wa4n62
3%
Tableau 1
       On pourrait croire qu'il s'agit d'un biais d'échantillonnage, mais les autres études montrent la même chose notamment celle de M. Liratni avec 95% de QIT non-interprétables en raison de l'hétérogénéité des Indices, souvent plus de 30 pts (2 écarts-type).





Malgré les différences de taille des échantillons et des critères (3) il apparaît (Graphique 2) que les courbes sont bien similaires, quelle que soit la source (Liratni et Pereirra). Par contre, le manuel du WISC IV sous-cote très visiblement l'ICV, en raison sans doute du faible nombre de l'échantillon HP (20 sujets) sur les 1100 de l'échantillon total. Même observation quant à la WAIS IV.
   En termes d'Indices, il existe donc un profil typique et très significatif des personnes sur- douées sur les trois sources. [2] dominance de l'ICV et chute de l'IVT.
<= Graphique 2

Si l'écart moyen des résultats lntra-registre reste proche de la norme des 3 pts, l'amplitude de ces écarts est bien plus considérable et concerne un pourcentage  important du groupe HP (tableau 3, sur Wi5n70) que l'on ne peut ignorer.
       Il s'en suit que cette population se caractérise ultra-majoritairement par des profils hétérogènes sur l'ensemble des indices. Donc ceux-ci ne sont pas toujours non plus  fiables en tant que représentation globale d'un registre pour 70% du panel.
        Il en résulte donc, pour les personnes surdouées, que la notion d'indices n'a que valeur indicative et non de "certification" et le QIT de même. Nous rejoignons là les observations des chercheurs,  comme Jacques Grégoire (4) et Jacques Lautrey (o.c.).
Notes Std
éc. moyen
éc. max/19
% éc. >3
ICV
2,03
9
34,29
IVS
1,80
8
14,29
IRF
2,11
6
30,00
IMT
2,23
9
35,71
IVT
1,99
6
30,00
Tableau 3


 4.7.4. Alors, quel seuil ?

Le seuil à 130 (Manuel), 132 (Mensa) ou tout autre est un discriminant illusoire. Jacques Lautrey (o.c.) :

« Dans la mesure où la distribution du QI est continue, et forme par convention une courbe normale, un tel seuil ne peut être fixé que de façon conventionnelle. La plupart des chercheurs ont fixé ce seuil à deux écarts-types de la moyenne, ce qui signifie que la proportion des sujets qui se situe au-delà représente 2,2% de la population de référence (en général la population des personnes du même âge). Avec une échelle de QI comme la WISC, où la moyenne du QI est fixée à 100 et l'écart-type à 15, un seuil fixé à deux écarts-types au-dessus de la moyenne correspond à un QI de 130. Ce seuil n'a aucune vertu particulière et compte tenu de la nature conventionnelle de la définition, les discussions sur la proportion d'enfants « surdoués » dans la population ou sur la vraie valeur du QI à partir de laquelle on peut considérer qu'un enfant est « surdoué » (135 ? 150 ?) sont dénuées de sens. »

Si QIT et Indices sont des discriminants fiables pour les QIT ≥ 130 à profil homogène, ils ne le sont  plus pour le profils hétérogènes, qui sont pourtant ultra-majoritaires chez les HP (de 92 à 97% selon les  Wechsler).

Alors, comment statuer sur la présence d'un éventuel surdouement intellectuel ?


Dire que Paul, qui mesure 1,80 m, est plus grand que la moyenne des français (1,75m) ne dit pas grand chose de sa morphologie, non plus que de sa personnalité. Si l'on veut connaître Paul, il faudra prendre en compte bien d'autres éléments. Il en est de même du surdouement.
    Un test d'efficience intellectuelle n'est pas un concours, avec un seuil-couperet (QIT ≥ 130), mais un outil de compréhension du fonctionnement intellectuel de la personne. Or, ce qui va révéler ce fonctionnement n'est pas la moyenne, mais ses composantes par les différences qu'elles présentent. Donc l'étude fine des différentes notes standard obtenues qui constituent le profil intellectuel avec ses forces et ses faiblesses. Si c'est plus complexe, c'est autrement plus parlant.
    Par ailleurs, un bonne interprétation des résultats ne peut faire l'impasse :
        1/ sur la passation
elle-même (observation des blocages, lenteurs, etc.)
        2/ sur l'histoire du sujet
(milieu familial, culturel, vécu antérieur...) et de son implication sur les résultats.

   Enfin, cela implique une bonne connaissance de cette population particulière qui, loin de présenter un profil comportemental unique (ce que laisse entendre les grilles comportementales en 12 ou 15 critères), montre à cet égard une très grande diversité (enfants comme adultes).


  4.7.5. IAG ou QIT ? 

J. Grégoire proposait pour cette population de remplacer le QIT par l'IAG (Indice d'Aptitude Générale), indice qui se compose des seuls ICV et IRP ou ICV+IVS+IRF (Wi5). Sur Wi4n120 , pour 50% l'IAG est  supérieur en valeur absolue au QIT,avec un gain moyen de 6,28 pts. Sur Wi5n70 le gain est de 5,08 pour 55,71% du panel. Mais, si l'on prend les conditions d'écart IAG/QIT posées par Grégoire (11 points d'écart) pour valider l'IAG, l'intérêt de ce mode de calcul ne concerne plus que 4% de l'échantillon sur Wi4n120. S'il augmente en moyenne l'IAG de 10 points par rapport au QIT pour les 4% concernées, l'intérêt se restreint à ce groupe.


 4.7.6. Le profil des notes standard


Graphique 4
L'on perçoit ici (graphique 4 et 5) la sous-cotation de la partie verbale (enfants comme adultes) par rapport au standard HP. On observe sur la Wais IV le grande dispersion de MdC et Ari, soit ce qui concerne la mémoire de travail.
    Il semble que dans les cas de grosses difficultés (dépres -sion, burn-out, mésestime de soi) le secteur verbal reste le plus élevé (plus rarement l'instrumen- tal), quand le reste s'effondre à la moyenne (inhibition) ou plus bas (blocages). Comme s'il y avait là un secteur très préservé.

Graphique 5

 4.7.7. La représentation graphique des notes standard

La restitution des résultats est importante, mais elle reste souvent abstraite pour le sujet, aussi est-il non moins essentiel qu'il puisse avoir une représentation visuelle compréhensible (enfants) de ses scores.
   À l'habituelle courbe de Gauss ou d'histogrammes calés sur le 1, nous préférerons suivre les préconisations de Jacques Grégoire soit un seuillage sur la moyenne du sujet. Cette représentation endonormée possède le mérite de mon- trer directement au sujet ses forces comme ses faiblesses et d'avoir ainsi une vision plus juste de sa réalité. Il est en effet plus intéressant pour l'adulte comme pour l'enfant, de visualiser la manière dont il fonctionne sur le plan intellectuel, plutôt que sa situation par rapport à la population générale.
     Par ailleurs, chez les jeunes enfants, la représentation sur la courbe de Gauss passe mal, ils ne comprennent pas qu'ayant obtenu des résultats supérieurs, ils se trouvent logés au pied de la courbe.
     Une note basse (< 9-11), de même que des écarts importants, ne cons- tituent pas automatiquement une dys... notamment sur les épreuves répé- titives (MdC, Code par ex.) qui sont de peu d'attrait chez les HP. Il s'agit souvent de blocages (par manque d'intérêt, impulsivité, refus de faire...), alors que la/les autres notes du même registre ne sont pas effondrées.


Graphique 9

 4.7.8.  Profil homogène = profil parfait ?

Le profil homogène serait donc le profil parfait, le sujet ayant développé toutes ses capa- cités au même niveau. Le graphique, ci-contre, montre un tel profil (QIT 160), avec un seul écart <= 3 pts. Ce profil pour exceptionnel qu'il soit (3,16/100 000) ne prouve qu'une chose : l'incapacité du test à discriminer plus fin, par absence d'épreuves assez sélectives. C'est l'effet plafond du test. La tâche serait d'ailleurs économiquement irréalisable. Un panel habituel d'étalonnage se situe autour de 1100 sujets, avec un tel groupe on ne détecte que 2,7 % de surdoués à QIT 130. À QIT > 160, on imagine sans peine  le panel qui serait nécessaire pour coter au-delà.
      En fait, un profil homogène est une illusion, on ne sait rien de ce qui se passe au- dessus de 19, il est vraisemblable qu'on retrouverait les mêmes écarts plus haut.
      L'hétérogénéité n'est pas une tare, mais le lot commun des humains. On ne développe des capacités de façon optimale que si l'on en sent le besoin ou la nécessité, autrement, elles demeurent latentes (qui peut le plus peut le moins) mais "réveillables".
    Mozart a-t-il développé ses capacités littéraires, Einstein ses capacités sportives, Zidane ses capacités picturales...? Pour quel bénéfice payant l'effort nécessaire ?
     L'intellect parfait n'existe pas et tant mieux pour la richesse humaine.
Graphique 10


 4.7.9. Chronosensibilité 

Le chronométrage de certaines épreuves peut induire du stress, il nous a donc semblé intéressant de mesurer cet éventuel impact sur les résultats. Il s'agit de calculer la différence entre les notes des subtests chronométrés et de ceux qui ne le sont pas.  On compare alors  les résultats obtenus avec le groupe HPstd. Il est vrai que cette différence peut aussi tenir au désintérêt ou au blocages de ces subtests, l'anamnèse et le comportement lors de la passation viennent alors confirmer ou infirmer le stress. Ainsi, 81,36% sont plus chronosensibles que les HPStd (>1,30) et 58,33% dépassent deux fois la moyenne HPStd (>2,6).                                                                  Graphique 11 =>
        Ce n'est pas neutre.                                                                                            



 4.7.10. Enduranc





Autre spécificité acsis-pm, le calcul de l'endurance ou de la fatigabilité du sujet. Il est important, de mesurer une éventuelle baisse des notes sur la durée du test, ce qui pourrait indiquer une fatigue intellectuelle en raison des efforts fournis ou de blocages ou inhibition. On mesure la pente des résultats sur le décours du test, par rapport au groupe HPStd. Une pente peu accentuée dénote d'une certaine stabilité émotionnelle et des capacités intellectuelles stables, le contraire permet de moduler l'interprétation des résultats.
<= Graphique 12


 4.7.11. Les épreuves optionnelles

Elles sont rarement passées pour ne pas allonger la prestation. Elles permettent d'affiner l'analyse en cas de blocage supposé sur une épreuve d'un registre. On les limite aux seules épreuves qui apporteront un plus en fonction et de l'anamnèse et de la passation. Elles n'interviennent pas dans le calcul du QIT ou des Indices.


4.7.12. Observations et Réflexions

La méconnaissance des finesses du test et de cette population amène des erreurs d'interprétation. Voici les plus fréquentes.

Dys... TDA, TED, etc.
Pour décréter qu'une personne présente des troubles dys.., TDA/H ou TED, il ne suffit pas d'une note basse au Wechsler.
Il faudrait au moins que :
    1/ les autres épreuves du même registre soient elles-mêmes en déficit important,
    2/ que les optionnels concernés aient montré aussi une valeur faible,
    3/ que cela soit perceptible et récurrent dans le quotidien du sujet.
    Enfin, en cas d'évaluation positive des trois points précédents,que des tests spécifiques du trouble en question soit passés et aussi positifs.
Nous voyons trop de pseudo-troubles, trop hâtivement déclarés, qui ne relèvent que de simples difficultés assez aisément remédiables.

Vitesse et intelligence
Il ne s'agit pas de remettre en cause le chronométrage des épreuves, mais de se poser la question : l'intelligence est-elle plus affaire de justesse de la réponse ou de rapidité de celle-ci ? Si le surdoué est en général rapide, voire très rapide, quant à la pensée, l'expression de celle-ci peut être lente, il est donc nécessaire de ne pas confondre les deux notions.
        Cette lenteur est due à plusieurs causes  :
1. la complexité et l'amplitude des champs inventoriés avant de parvenir à la réponse (le temps de faire le tour de la question) ;
2. la difficulté à inhiber les distracteurs émotionnels (manque de  confiance en soi, anxiété majeure...) ;
3. le perfectionnisme ou la recherche d'une complexité absente ;
4. la dépression et certains médicaments, etc.

La rapidité peut avoir des effets négatifs, par exemple, se focaliser sur un mot et non sur l'ensemble de la question (hors sujet). C'est l'observation du sujet par le psychologue, pendant la passation, qui lui permettra de moduler son évaluation, ce qui implique de noter pendant celle-ci les éléments pertinents du comportement.

Mémoire de travail et intelligence
Les deux subtests qui composent ce registre sont très sensibles au stress (chronomètre) et nombre de personnes surdouées sont déstabilisées par ce type de subtest répétitif et sans portée utile et concrète. Leur mémoire de travail est plus orientée sur les mots. IMT partage d'ailleurs avec Cubes et IVT les écarts-type les plus élevés (>3), les réponses ne sont donc pas homogènes pour cette population, selon leur état et leur gestion du stress.

Dépression, anxiété, mésestime, perfectionnisme et intelligence
Poser, lors de l'anamnèse, un  état de dépression, d'anxiété forte ou de manque majeur de confiance en soi et proposer quand même le test ne revient qu'à mesurer les seuls niveaux d'anxiété, de dépression, de perfectionnisme ou de mésestime. Parfois, ce peut être important pour que la personne prenne conscience de son état et de l'impact sur son intellect.

Indices, homogénéité/hétérogénéité et Intelligence
Décréter au vu des indices que le profil est homogène, n'est correct que si chacun des registres l'est lui-même, sinon il s'agit d'une fausse homogénéité. Exemple concret, homme de 49 ans (WAIS IV) :

ICV
IRP
IMT
IVT
QIT
Conclusion
106
107
97
92
100
Intelligence moyenne homogène.
Tableau 13
Le profil est apparemment homogène (Tableau 1), car l'écart maximal entre les indices ne dépasse pas les 15 pts. Mais, si l'on regarde de plus près le profil des notes standard (Tableau 14), une autre approche se fait jour : l'empan pour chaque registre dépasse les 3 points et pour l'ensemble des deux registres l'écart est de 9  et 5 points, ce profil n'est plus homogène. Il y a lieu d'interroger Informations et Puzzle et de confirmer par les subtest optionnels.
ICV
Note IRPNote
Sim
12
Cub
10
Voc
15
Mat
13
Info
6
Puz
8
Comp
11
CIm
10
Écarts
9

5
Tableau 14
Chaque registre (ICV, IRP, IMT, IVT est considéré comme homogène si l'écart maximal est de 3 points entre les notes standard qui le composent. Ici, seuls IMT et IVT répondent de cette norme. ICV est particulièrement hétérogène et IRP bien au-dessus de la norme. Ces deux indices n'étant pas homogène, le profil des indices ne peut être pertinent et le calcul du QIT est illusoire. L'anamnèse faisait état d'anxiété majeure et de TOC (Troubles Obsessionnels Compulsifs) : dans un tel état le test n'aurait pas dû être proposé au sujet, du moins pas avant d'avoir réglé/modéré les troubles. Il y a, de plus, une distorsion qui aurait dû alerter le praticien, un homme  de 49 ans avec Informations à 6, donc une culture générale très faible, ne pourrait avoir un Vocabulaire à 15 et ce 6 à Informations s'avère peu compatible avec un niveau universitaire pourtant dument relaté.
      Nous sommes là dans une lecture mécanique et rentable du test, mais sans finesse ce qui est un comble.

Cubes et intelligence
L'ultra-majorité des personnes surdouées présentent une prédominance très forte de l'ICV, donc un fonctionnement à partir du raisonnement verbal. Commencer le test par une épreuve instrumentale (Cubes) les défavorise, depuis la version IV. Dans la version précédente WISC III, Cubes était situé au milieu du test. Sur nos études (Wi4n50 et Wi3n273), nous avons noté une baisse de 15,12  à 12,50, soit : 2,62 points/19, en moyenne sur Cubes, le contenu du subtest n'ayant pas changé. Il serait bon de le ressituer comme dans la version III, au moins pour les personnes surdouées.

Auto-limitation
Ce comportement au test se remarque chez certains enfant (surtout jeunes sur WPPSI ou moins de 8 ans sur WISC) et donne des résultats très en-dessous de la réalité. On observe en effet un plafonnement systématique sur certains registres, en général autour de 14 pts (ICV et IRP) quand les autres registres fluctuent normalement. Il s'agit là d'un refus de l'effort : "si je ne trouve pas du premier coup, j'abandonne" ou par conformation sociale (ne pas paraitre différent), surtout si le psychologue omet de stimuler.



Un bon outil ne suffit pas pour un travail de qualité, il faut aussi un bon ouvrier, ayant tout autant une bonne connaissance de l'outil, que du matériau sur lequel il travaille, surtout quand ce matériau est l'humain et ici l'humain surdoué.

La mesure de l'intelligence implique l'intelligence de la mesure.