Psychologie différentielle et psychométrie
Psychologie différentielle et psychométrie
Qu’est-ce que la psychologie différentielle ?
- I. Différences quantitatives et qualitatives
Il y a des conduites générales au niveau du développement cognitif de l’enfant. Cependant, il y a une grande variabilité interindividuelle des conduites.
- A. Exemple du langage
En moyenne, le 1er mot est vers 8 mois ; 10 mots vers 1 an ; 60 mots vers 16 mois.
Pourtant à 16 mois, il y a des différences quantitatives à âge égal dans la vitesse d’acquisition du langage.
- Pour 10% des enfants : production de 150 mots.
- Pour 10% des enfants : aucun mot
Pourtant à 50 mots environ, il y a des différences qualitatives à quantité de mots égale dans le style d’acquisition du langage.
- Pour certains enfants ( référentiels ): majorité de noms d’objets ( + adjectifs )
- Pour d’autres enfants ( expressifs ) : majorité d’emplois de phrases ( prépositions, relations ).
- II. Représentation schématique des différences quantitatives et qualitatives
- A. Exemple de la conservation des liquides
Il y a deux modes de traitement dans l’épreuve de conservation de la quantité de liquide derrière un écran.
Participants : enfants de 5-6 ans non conservants à l’épreuve de Piaget.
Epreuve de conservation derrière un écran :
- Certains répondent : autant car c’est la même eau. Traitement global, basé sur l’identité de l’objet.
- Certains répondent : plus ( ou moins ) car c’est plus ( ou moins à haut. Traitement analytique basé sur la dimension hauteur.
- III. Traitement de deux aspects différents de l’information disponible
- A. Stabilité des différences
Il faut s’assurer que la variabilité observée ne provient pas seulement de l’imperfection des mesures. Les différences doivent refléter les caractéristiques individuelles.
Si c’est le cas, les différences sont l’expression de caractéristiques individuelles stables, constitutives de l’individu et méritent d’être étudiées. Seules les différences relativement stables et prévisibles constituent l’objet de la psychologie différentielle.
Comment vérifier la stabilité des mesures ? Par exemple, on peut faire passer deux fois la même épreuve. En effet, le classement des individus devrait être à peu près le même.
- B. Différences interindividuelles et inter-groupes
- 1. Différences entre individus
Les domaines sont variés : intelligence, personnalité, créativité…etc. On va ordonner les individus ( différences quantitatives ) ou classer les individus ( différences qualitatives ).
La validité : le but est de savoir à quoi correspond ce que l’on a mesuré.
- Validité théorique ou conceptuelle : à quelles dimensions psychologiques renvoient les différences observées ?
- Validité empirique : quelle adaptation ? Prédire l’adaptation ( scolaire, professionnelle ) et diagnostiquer les difficultés.
- 2. Différences entre groupes
Mise en relation avec d’autres systèmes de classification. Par exemple, sociologique ( catégorie socioprofessionnelle, revenu ), biologique ( genre ), culturel ( niveau éducatif ).
- C. Validité empirique : prédire
Les épreuves de conscience phonémique ( identifier les sons des mots ) passées en grande section maternelle prédisent-elles l’apprentissage de la lecture au cours préparatoire ?
Calcul de corrélation
- Si corrélation positive significative, cela indique que les enfants ayant eu des scores élevés aux épreuves de conscience phonémique tendent à apprendre assez facilement à lire ;
- Les enfants ayant eu des scores faibles aux épreuves de conscience phonémique tendent à apprendre plus difficilement à lire.
Attention, une corrélation n’est pas une relation causale. Il peut exister une source de variation commune ( à l’origine de la co-variation entre les scores de lecture et de conscience phonémique ).
- D. Différences intra individuelles
Il y a un profil d’aptitudes particulier pour chaque individu. Dès la naissance, le bébé a des comportements variés qui vont s’adapter en fonction des réponses de l’environnement.
- IV. Les méthodes d’étude des différences
- A. Méthodes expérimentale et quasi expérimentale
Effets différentiels des variations de situation sur les individus.
Exemple : conservation du nombre avec de petits et grands ensembles de jetons
- VI provoquée : Certaines variations relatives aux individus sont fixées préalablement à l’expérimentation.
Exemple : le genre ou l’habitat
Exemple : le style d’acquisition du langage, la capacité de mémoire de travail
- VI invoquée ( VI « étiquette » ) : Etude de la corrélation entre deux variables. Recherche de sources de variation communes par l’analyse factorielle pour comprendre comment s’organisent de multiples variables toutes corrélées les unes avec les autres
- B. La corrélation estime les variations de classement des individus
- C. Les origines de la psychologie différentielle
- La naissance de la psychologie scientifique : possibilité d’étudier de manière objective des phénomènes psychiques et de répliquer les mesures
- La théorie de Darwin sur l’évolution des espèces : transposition aux conduites et aux processus mentaux
- Demande sociale d’évaluation objective des personnes : orientation scolaire et professionnelle, dépistage, sélection
- D. La psychologie différentielle actuelle
- Les applications : la psychométrie ( évaluer ) avec les tests, questionnaires, etc.
- La recherche fondamentale ( comprendre, expliquer ) avec la psychologie cognitive, sociale ou psychopathologique
La psychométrie
- I. Les tests
- A. Définition
- Situations standardisées d’observation des conduites
- Donnant lieu le plus souvent à une évaluation quantitative
- Pour situer l’individu dans une population de référence
- Evaluation relative ( et non absolue )
- Nécessité d’étalonnage
Le but du test est d’obtenir une qualification ou une quantification des individus dans une catégorie. Il permet de situer l’individu dans une population de référence.
Formes diverses :
- Tests d’efficience : intelligence, aptitudes, connaissances. Une bonne réponse.
- Tests de personnalité : intérêt, caractère, affectivité. Pas de bonne réponse. Questionnaires, tests projectifs.
- B. L’apport théorique
è Un complément à la psychologie générale
- Moduler les lois selon les individus ou les groupes d’individus
- Expliquer le développement par la variabilité intra-individuelle
è Identifier les dimensions psychologiques qui sous-tendent les performances aux tâches cognitives
- Exemple : l’analyse factorielle pour résumer de gros ensembles de données
è Identifier les processus cognitifs
- Mettre en relation des processus bien spécifiés, élémentaires ou non, et des aptitudes plus générales
- C. Objectif de la psychométrie
On cherche à mesurer une caractéristique psychologique individuelle le plus objectivement possible pour la comparer à celle obtenue dans la même situation par des personnes issues de la même population.
La mesure n’a pas de valeur absolue mais permet de classer l’individu pour ce comportement précis par rapport à un groupe de référence, représentatif de la population concernée.
- D. Les tests mentaux
Psychométrie : mesurer des phénomènes psychologiques
- Ceux-ci ne peuvent pas être observés directement
- Ils sont inférés à partir de comportements manifestes : nombre de bonnes réponses à une épreuve de mémoire, réponses à un questionnaire d’anxiété, etc.
Ce sont des situations très rigoureuses d’observation : les tests psychologiques ( ou mentaux ) permettent d’enregistrer un comportement précis ( expliquer un mot, résoudre un problème, rappeler une suite de chiffres, juger de la véracité d’une affirmation, etc. ).
- II. Le bilan psychologique
- A. Définition
Le but d’un bilan psychologique est d’évaluer le fonctionnement de l’enfant sur les plans intellectuel, affectif et social. Il y a deux aspects essentiels : bilan cognitif et bilan affectif. Les motifs sont multiples : difficultés d’apprentissage, comportements problématiques
Sur le plan intellectuel : tests d’intelligence ou cognitifs. Le but est de situer l’enfant par rapport à la moyenne des enfants du même âge. Calcul d’indices d’aptitudes.
Sur le plan affectif et social : entretien, tests de personnalité ( dessin ), observation en classe, jeu… Le but est d’analyser les aspects relationnels et ( intra ) psychique.
- B. Conduite du bilan psychologique
- Entretien préliminaire avec les parents ( éventuellement l’enseignant ) : anamnèse et étude de la demande.
- Séance avec l’enfant seul : dessin ou modelage, passation de tests en une ou deux fois selon l’âge et le rythme de l’enfant.
- Entretien de restitution avec un compte rendu écrit et des propositions de prises en charge.
- III. Une évaluation objective des différences : la standardisation
Grâce à ces tests psychologiques, on a une évaluation objective des différences car on considère qu’ ayant reçu tous les enfants dans la même situation, les différences de performance d’un individu à l’autre dépendent seulement de leurs caractéristiques propres, pas des différences de situation.
- A. Définition
Nécessité de standardisation : placer tous les individus exactement dans la même situation.
La situation : les questions, les problèmes, le matériel, l’ordre de passation, le temps imparti, etc. sont fixés.
- La consigne de l’épreuve, exactement identique pour tous
- Le mode d’évaluation des réponses : éliminer l’interprétation personnelle subjective. Cela signifie que peu importe le psychologue qui corrige les réponses, on devrait toujours trouver le même score.
- Attitude neutre et bienveillante du psychologue : la même pour tous les individus testés
- Principe précis de cotation des réponses
- B. Le but de la standardisation
La standardisation élimine les erreurs de mesure systématiques liées :
- à des différences de situation d’un individu à l’autre
- à des différences d’interprétation d’un psychologue à un autre
L’évaluation est dite objective. Cependant, il reste des erreurs de mesure aléatoires dues :
- à l’interaction unique entre le psychologue et la personne examinée
- aux conditions uniques de l’examen : état de la personne ( ex. fatigue, etc. ) et conditions extérieures.
- IV. Une évaluation fiable des différences : les qualités métriques
- A. La sensibilité
Une bonne sensibilité est nécessaire pour bien différencier les individus les uns des autres parce que deux personnes de même score seront en réalité différentes.
La sensibilité dépend de :
- L’étendue maximale des scores au test : elle peut souvent être améliorée en augmentant le nombre d’items et en proposant des items de différents niveaux de difficulté ( tests d’efficience ).
- L’adaptation du test à la population : Si le test peut être noté de 0 à 50 mais que tous les individus ont un score entre 40 et 50 ou entre 0 et 10, il n’est pas assez sensible. Il est soit trop facile, soit trop difficile.
- 1. Etude de la sensibilité d’un test
- Etape 1 : Calcul d’un indice de difficulté par item (% de réussite)
Il correspond au % de réussite de l’item dans l’échantillon de référence. Le pouvoir différenciateur d’un item est nul lorsque le % de réussite est de 100% ( l’item est réussi par tous ) ou de 0% ( l’item est échoué par tous ). Il est maximum lorsque le % de réussite est égal à 50%. Comme on veut des items de difficulté graduée, des faciles, des moyennement difficiles et des difficiles, on choisit en général des items pour lesquels le % de réussite est compris entre 20% et 80%.
- Etape 2 : Distribution des résultats au test entier et analyse de sa forme
- B. L’unidimensionnalité des items ( homogénéité )
On veut n’évaluer qu’une seule caractéristique ou dimension.
Exemple : matrices à compléter. Raisonnement perceptif de type inductif. Trouver la règle et l’appliquer.
Il faut vérifier que les items faciles et difficiles, présentés en carrés de 4 et 9 cases et en ligne impliquent la même capacité ou le même ensemble de capacités. Il s’étudie d’un point de vue théorique ( analyse d’experts ) et aussi d’un point de vue formel.
- 1. Etude de l’homogénéité d’un test
Il faut s’assurer que la réussite à chaque item est bien associée au score global
- Etape 1 : Calcul de la corrélation item
Elle indique que ceux qui réussissent l’item ont tendance à avoir des scores élevés au test tandis que ceux qui échouent ont tendance à avoir des scores bas
- Etape 2 : Analyse des courbes caractéristiques d’items
Mise en relation du score global et du % de réussite à chaque item
- C. Les erreurs de mesure : la fidélité
Les mesures doivent refléter les caractéristiques des individus, non des erreurs de mesure. La standardisation élimine les erreurs de mesure systématiques. Cependant, il reste des erreurs de mesure aléatoires. L’objectif est qu’elles soient les plus faibles possible.
On évalue la taille des erreurs aléatoires grâce au calcul de la fidélité. Toute mesure inclut un score vrai et un score d’erreur, tous deux inconnus. Lorsque l’on répète la mesure ou lorsque l’on effectue une autre mesure avec un test analogue, le score vrai reste le même.
Si deux mesures analogues conduisent à des classements très similaires, l’épreuve a une bonne fidélité. Si au contraire, le classement des individus est largement modifié d’une passation à l’autre, l’épreuve ne mesure rien de bien défini.
- 1. Etude de la fidélité d’un test
- Etape 1 : Calcul d’un coefficient de corrélation
Il est impossible de mesurer un caractère sur l’ensemble d’une population ; c’est pourquoi on travaille sur des échantillons d’individus.
On élève la valeur du coefficient de corrélation, r au carré ; ainsi r² indique dans quelle mesure on peut prédire ( « expliquer » au sens statistique ) la variance de y à partir de celle de x ( description ).
- r = 0,90 ; r² = 0,81 ; 81% de la variance de y peut être prédite à partir de celle de x. Il reste 19% non expliquée.
- r = 0,70 ; r² = 0,49 ; 49% de la variance de y peut être prédite à partir de celle de x. Il reste 51% non expliquée.
Ne pas confondre corrélation significative ( statistique inférentielle ) et corrélation forte ou faible ( statistique descriptive ). Une corrélation significative indique qu’elle peut être généralisée de l’échantillon sur lequel elle a été calculée à la population représentative. Une corrélation forte, moyenne ou faible permet de décrire la relation entre les variables ( en élevant le coefficient au carré ). On n’interprète que les corrélations significatives. Il peut y avoir des corrélations faibles significatives ( si l’échantillon est très grand ).
- Etape 2 : Les deux significations de la notion de fidélité
Stabilité ou constance dans le temps = répétition de la mesure à 2 moments différents
- Les individus passent 2 fois le même test : calcul d’un coefficient de corrélation.
- La fidélité dépend du délai entre les 2 passations.
Equivalence entre les items = présentation de 2 ensembles d’items différents mais analogues.
- Le test est séparé en 2 parties ( méthode split-half ). Les individus ne passent qu’un test mais ont 2 scores, l’un pour les items pairs, l’autre pour les items impairs : calcul d’un coefficient de corrélation.
- On établit 2 formes parallèles A et B du même test. Les individus passent les 2 formes : calcul d’un coefficient de corrélation.
è La corrélation entre 2 mesures du même type est la fidélité ; elle permet d’estimer l’ampleur des erreurs aléatoires de mesure.
- D. La validité
Toutes les qualités psychométriques précédentes ( sensibilité, homogénéité et fidélité à sont nécessaires mais insuffisantes. Il faut que le score obtenu corresponde bien à ce que l’on attendait.
- 1. La validité empirique d’un test
On veut que le score obtenu évalue réellement ce qu’il est censé évaluer : diagnostic et pronostic.
- Validité diagnostic : On a vérifié que le test pour le groupe diagnostic les difficultés. On l’utilise alors sur un enfant pour comparer son niveau à l’échantillon représentatif de la population.
- Validité empirique : Pour calculer la prédiction d’un test vis-à-vis de la réussite scolaire ultérieure, on va mesurer la réussite scolaire des enfants à plusieurs moments.
Exemple :
- Validité diagnostique d’un test vis-à-vis de l’apprentissage de la lecture : détecter les difficultés spécifiques = capacités phonologiques, vocabulaire, etc.
- Validité prédictive : on calcule la corrélation (r) entre le score au test, le prédicateur (QIT par ex.) et le critère (réussite scolaire ultérieure par ex.). R² indique dans quelle proportion on peut prédire la réussite à partir du QIT.
Bonne validité empirique du WISC
Corrélation moyenne entre le QI total et les acquis scolaires : de 0,50 à 0,70
- de 0,45 à 0,65 pour la lecture
- de 0,40 à 0,70 pour les mathématiques
- 2. La validité théorique ou conceptuelle d’un test
Calcul de corrélation entre le QIT (WISC) et d’autres tests censés mesurer l’intelligence : autour de 0,70-0,80.
Justifier le contenu du test :
- Epreuve isolée : analyse du contenu des items ( cf. Unidimensionnalité ). On veut que le score obtenu évalue réellement ce qu’il est censé évaluer : l’intelligence, les aptitudes intellectuelles.
- Echelle composite ( intelligence, indice d’aptitude ) : analyse du contenu des sous-tests.
- Le calcul d’un score global, QI total, nécessite que le score à chaque sous-test contribue au score global. On attend des corrélations positives entre le score des sous-tests et le score total.
- On attend aussi des corrélations positives entre tous les sous-tests pris 2 à 2, ce qui est compatible avec une source de variation commune, un facteur général.
- On utilise une méthode statistique, l’analyse factorielle, pour déterminer cette source de variation commune à tous les sous-tests si elle existe.
- V. Le résultat à un test : une évaluation relative
Le score brut ( nombre de points obtenus ) n’a aucune valeur absolue. Il n’a une valeur que par comparaison aux scores obtenus par un groupe de référence, c’est-à-dire un échantillon représentatif de la population. Il est nécessaire de construire un étalonnage, un barème pour établir des classes ordonnées dans le groupe de référence.
Ex. score 10 = parmi les 10% des scores les plus bas.
Transformation des scores bruts en scores comparatifs ou scores standards pour situer la performance observée dans le groupe de référence. Pour comparer le score observé à la performance moyenne des individus ayant les mêmes caractéristiques ( âge, sexe, etc. ), il faut avoir constitué des groupes de référence ( échantillonner les individus ).
- A. L’échantillonnage des sujets
L’échantillonnage des sujets est la sélection d’un groupe d’individus ayant les mêmes caractéristiques que la population à laquelle le test est destiné ( échantillon représentatif ).
- 1. Méthode empirique
La méthode empirique est la méthode des quotas : choix des caractéristiques d’échantillonnage ( âge, sexe, CSP ) et reproduction dans l’échantillon de leur distribution dans la population.
- 2. Méthode aléatoire
Le principe général de la méthode aléatoire est de tirer au sort dans la population un nombre suffisant d’individus qui devrait reproduire ses caractéristiques dans l’échantillon. Mais il faut avoir une liste exhaustive de tous les individus.
- 3. Méthode mixte
La méthode mixte est l’échantillonnage en grappe : on tire au hasard des groupes dans lesquels tous les individus sont testés.
Exemple : On tire au sort a) un groupe de communes, b) parmi les villes et villages sélectionnés, un groupe d’établissements scolaires, c) un sous-ensemble de classes.
- B. L’étalonnage
Le but de l’étalonnage est d’établir un barème de référence pour l’échantillon représentatif. Il y a deux méthodes : quantilages et échelles normalisées.
- 1. Les quantilages
Les classes sont de taille équivalente : distribution rectangulaire.
Exemple : 10 classes incluant chacune 10% des individus = décilage ( 100 classes = centilage ).
On transforme les scores observés ( ex. sous-test de 0 à 40 ) en scores standard de 1 à 10. On peut ainsi comparer des sous-tests n’ayant pas le même nombre d’items.
L’inconvénient est que l’on observe des effectifs plus élevés pour les scores moyens et des effectifs plus faibles pour les scores extrêmes. Le test étalonné selon une distribution rectangulaire est trop discriminant au centre, pas assez discriminant aux extrêmes.
- 2. Les échelles normalisées
On se réfère aux propriétés de la loi Normale ( Laplace-Gauss ). Si on connaît la moyenne et l’écart type, on peut déterminer le pourcentage de la population au-delà et en deçà d’une valeur donnée. On construit des classes d’intervalles égaux en fractions d’écarts types.
- C. Le calcul du QIT
- Recueil : notes brutes pour les 10 sous-tests obligatoires.
- Transformation de chaque note brute en note standard de 1 à 19 pour l’âge considéré, grâce aux tables de conversion.
Une note standard correspond à la distribution normalisée de la note brute recueillie dans l’échantillon de référence de l’âge considéré. Par construction, tous les sous-tests dans l’échantillon de référence suivent une distribution normale de moyenne 10 et d’écart type 3. Chaque note standard est un rang dans la population.
- Addition des notes standards (1 à 19) des 10 sous-tests.
Transformation du total en note standard, le QIT. Le QIT suit une distribution normale de moyenne 100 et d’écart type 15. Le QI total est un rang dans la population ( non un quotient ).
- D. L’interprétation des résultats
Par convention statistique, un score standard est considéré comme « normal » s’il est compris entre –s et +s ( environ 68% des individus ). Exemple du QIT entre 85 et 115.
Mais il faut tenir compte des erreurs de mesure ( fidélité ). C’est pourquoi les manuels de test fournissent les intervalles de confiance, c’est-à-dire des intervalles dans lesquels le score vrai a 90% ou 95% de chance de situer, compte tenu des qualités du test.
Exemple : le score vrai d’un enfant ayant obtenu un QIT de 85 au WISC-IV a 95% de chances de se situer entre 81 et 94.
Des différences significatives entre les scores à divers sous-tests fournissent aussi des indications ( profil ). Attention, s’il y a une trop grande hétérogénéité des scores aux sous-tests, il ne faut pas calculer de QIT.
Il faut tenir compte des observations cliniques : fatigue, anxiété, contact difficile avec le psychologue, problème culturel, etc., qui peuvent amener une sous-estimation des performances.
Les tests ne représentent qu’une méthode parmi d’autres dans le cadre d’un bilan clinique. L’interprétation du résultat à un test s’intègre dans un ensemble d’autres éléments prenant en compte l’histoire personnelle de l’individu et ses difficultés actuelles ( entretiens, anamnèse et tests de personnalité, projectifs ).
Bibliographie
- Bernaud, J.-L. (2000). Tests et théories de l’intelligence. Paris, Dunod. (coll. Topos). Chap. 2.
- Eme, E. (2001). Psychologie Différentielle. Paris, Armand Colin (coll. Campus). Chap. 2 et 3.
- Lautrey, J. (1999). Histoire et évolution de la psychologie différentielle. In P Y Gilles (Ed.), Psychologie Différentielle. Rosny, Bréal (coll. Grand Amphi). Chap. 1. pp. 17-55.
- Huteau, M. & Lautrey, J. (1997). Les tests d’intelligence. Paris, La Découverte. (coll. Repères). Chap 2.
- Huteau, M. (2006). Origine et évolution de la psychologie différentielle. In S. Ionescu & A. Blanchet (Eds.), Psychologie du développement et psychologie différentielle. Paris, PUF. Chap. 7. pp 289-321.
- Huteau, M. & Lautrey, J. (1999). Evaluer l’intelligence. Psychométrie cognitive. Paris, PUF (coll. Psychologie et sciences de la pensée). Chap. 3 et 4.
- Bernaud, J.-L. (2000). Tests et théories de l’intelligence. Paris, Dunod. (coll. Topos). Chapitres 1 et 3.
- Eme, E. (2001). Psychologie Différentielle. Paris, Armand Colin (coll. Campus). Chapitre 4.
- Gilles, P.-Y. (1999). Psychologie Différentielle. Rosny, Bréal (coll. Grand Amphi). Chap. 3 : l’organisation des conduites par P.-Y. Gilles. Chap. 4 : différences individuelles et processus cognitifs par J. Juhel.
- Grégoire, J. (2009, 2ème édition). L’examen clinique de l’intelligence de l’enfant. Fondements et pratiques du WISC-IV. Bruxelles, Mardaga.
- Huteau, M. (2006). La méthode des tests. In S. Ionescu & A. Blanchet (Eds.), Psychologie du développement et psychologie différentielle. Paris, PUF.
- Huteau, M. & Lautrey, J. (1999). Evaluer l’intelligence. Psychométrie cognitive. Paris, PUF.
- http://www.slate.fr/story/45675/augmenter-qi-quotient-intellectuel
- http://www.lemonde.fr/planete/article/2010/09/20/trop-de-manganese-dans-l-eau-reduit-le-qi-des-enfants_1413772_3244.html
- http://fr.wikipedia.org/wiki/Quotient_intellectuel