John Libbey Eurotext

Gériatrie et Psychologie Neuropsychiatrie du Vieillissement

MENU

Comparaison des performances à l’épreuve des 15 mots de Rey et au RL/RI 16 dans le vieillissement normal et la démence de type Alzheimer Volume 12, numéro 2, Juin 2014

Illustrations

  • Figure 1
  • Figure 2

Tableaux

L’apprentissage d’une liste de mots est une tâche traditionnellement utilisée en neuropsychologie [1] pour mettre en évidence des déficits mnésiques chez un individu. Parmi les tests francophones disponibles évaluant la mémoire épisodique en modalité verbale, l’épreuve de rappel libre/rappel indicé à 16 items (RL/RI 16) [2] de même que le test des 15 mots de Rey (RAVLT) [3] sont fréquemment utilisés. Bien qu’ils évaluent le même construit, ces deux tests présentent des différences méthodologiques qui peuvent avoir d’importantes répercussions sur l’évaluation de populations particulières, telles que les patients souffrant d’une démence de type Alzheimer (DTA). Cette pathologie se caractérise par des troubles sévères de la mémoire épisodique et il importe alors de choisir un test permettant de bien évaluer la performance de l’individu suspecté de souffrir d’une telle atteinte. En effet, un test trop facile ne permet pas de détecter des troubles subtils de la mémoire, comme c’est le cas chez des individus qui souffrent de troubles cognitifs légers. Un test trop difficile n’est pas non plus souhaitable puisqu’il donne lieu à des effets planchers ce qui augmente la difficulté à estimer adéquatement le niveau d’atteinte de l’individu et risque d’entraîner un sentiment d’échec chez le participant.

La tâche de RL/RI 16 a été adaptée par Van der Linden et al.[2] à partir de la tâche de Grober et Buschke [4, 5]. Le test a été traduit en français et transposé d’un matériel visuel à verbal (mots). L’idée centrale derrière la conception de cette tâche est de permettre, par le biais d’un indiçage sémantique, le contrôle de l’encodage et de la récupération des informations. En isolant les processus impliqués dans la réalisation de la tâche mnésique, il est alors plus facile de comprendre les mécanismes déficitaires chez les individus qui échouent la tâche. Ce test présente donc l’avantage de pouvoir mieux isoler les processus en jeu dans la réalisation d’une tâche mnésique à savoir l’encodage, le stockage et la récupération. Il permettrait de dépister les troubles mnésiques dès la phase prodromale de la DTA [6]. Il comporte cependant certains désavantages. Ainsi, la richesse de l’encodage conduirait la grande majorité des individus présentant une faible ou aucune atteinte cognitive à obtenir le score maximal dans certaines conditions du test (i.e. effet plafond) [2], ce qui ne permet pas de différencier ces patients en début de maladie des personnes sans trouble cognitif (sensibilité).

La tâche de RL/RI 16 vise à contrôler l’apprentissage des mots à mémoriser en fournissant un indice sémantique précis, la catégorie, au moment de l’encodage. Quant au test RAVLT, il ne permet pas au participant de mémoriser les mots en fonction d’une règle ou d’un indice sémantique particulier puisqu’il consiste en l’apprentissage d’une liste de 15 mots non reliés entre eux (catégories sémantiques différentes). Ce test, développé par André Rey en 1964 [3], a subi de nombreux ajouts au cours des ans, dont l’inclusion d’une seconde liste pour les effets d’interférence proactive et rétroactive1 et l’addition de mesures de récupération différée (rappel libre -RL- et reconnaissance). Ce test est très sensible aux effets de récence et de primauté puisqu’il n’existe pas de tâche distractrice entre la répétition d’une liste et le début du rappel et que les mots sont présentés dans le même ordre à chacun des 5 essais d’apprentissage. En outre, la seconde liste et le délai introduit avant le rappel libre différé (RLD) ont pour effet de compromettre significativement la récupération des mots chez le patient DTA, d’où l’observation possible d’effets plancher. Certaines recherches ont démontré néanmoins que cet outil est pertinent dans l’évaluation de sujets DTA ou présentant des troubles cognitifs légers [7, 8] et que les scores obtenus à ce test (RL et RLD) corrèlent significativement avec la sévérité de la démence [9].

L’utilisation du RL/RI 16 semble faire l’unanimité pour l’évaluation de la mémoire au cours du vieillissement dans le monde francophone. Cependant, de nombreux praticiens, notamment anglo-saxons, ont recours à des tests de mémoire ne contrôlant pas l’encodage comme le RAVLT et le California verbal learning test (CLVT) [10]. L’intérêt de ces deux types de tests de mémoire ressort également de l’analyse de la littérature qui ne montre pas l’avantage d’un encodage contrôlé dans le diagnostic de la DTA [12]. D’ailleurs, les recommandations internationales quant à l’évaluation des troubles cognitifs légers suggèrent le recours à un test d’apprentissage d’une liste de mots sans favoriser un type de test par rapport à l’autre [1, 11].

La comparaison et donc le choix entre ces deux tests n’a jusqu’à ce jour fait l’objet d’aucune étude auprès d’un échantillon homogène de participants. Cet article vise à caractériser le patron de performance de personnes âgées sans trouble cognitif et d’individus souffrant de DTA débutant au test RAVLT et à l’épreuve RL/RI 16. Les objectifs sont 1) la comparaison des courbes d’apprentissage, 2) et de la rétention, 3) l’analyse quantitative et qualitative de la reconnaissance et des faux souvenirs (intrusions et fausses reconnaissances), 4) l’examen des effets plafond et des effets plancher, et 5) l’évaluation de leur spécificité et sensibilité.

Méthodologie

Participants

Cette étude rétrospective a été effectuée auprès de 40 personnes âgées sans trouble cognitif et de 40 individus DTA, soit un total de 80 participants. Les participants provenaient de deux recherches différentes, chacune comptant pour 50 % des participants. Les participants de la première étude avaient complété l’épreuve RL/RI 16 alors que les participants de la deuxième étude se sont vus administrer le test RAVLT. Aucune différence significative n’était constatée entre les groupes témoins et DTA dans les deux études (tableau 1) pour l’âge et le niveau de scolarité ainsi que pour le fonctionnement cognitif général évalué par le Mini mental state examination (MMSE) et la Dementia rating scale (DRS).

Tous les patients DTA ont été référés par des médecins de l’Hôpital Notre-Dame du Centre hospitalier universitaire de Montréal (CHUM) et diagnostiqués selon les critères du DSM IV-TR. Les patients étaient tous à un stade débutant de la maladie (MMSE moyen de 25,7/30). Les participants du groupe témoin ont été recrutés par affichage dans des lieux publics. Cette recherche a été approuvée par le comité d’éthique de la recherche du CHUM et tous les participants de l’étude ont signé le formulaire de consentement.

Les critères d’exclusions englobaient tout antécédent neurologique, psychiatrique ou maladies pouvant être associées (diabète, insuffisance rénale, etc.) ainsi que l’abus de substances ou la présence de déficit sensoriel ou intellectuel.

Matériel et procédure

Tous les participants ont été soumis à un examen neuropsychologique comprenant des épreuves visant à mesurer les fonctions exécutives, la mémoire, le fonctionnement cognitif général, la perception visuelle et le langage (tableau 2). La cotation de l’ensemble des tests pour les deux études a été faite sous la direction du chercheur principal.

Tâche de RL/RI 16

Cette tâche comporte 16 mots appartenant à 16 catégories sémantiques différentes. Pour chaque mot à apprendre, le participant doit identifier en pointant et en lisant à haute voix le mot sur la fiche correspondant à celui de la catégorie sémantique évoquée par l’expérimentateur. Lorsque tous les mots de la fiche ont été identifiés correctement, la fiche est placée hors de la vue du participant et on procède au rappel indicé immédiat. L’expérimentateur nomme la catégorie sémantique et le participant doit fournir le mot associé. Si certains mots ne sont pas récupérés, l’examinateur présente à nouveau la fiche et reprend l’identification des mots manquants par pointage et lecture à haute voix, avant de retourner à nouveau la feuille et interroger le participant sur ces mots manquants. Ceci peut être effectué un maximum de 3 fois pour chacune des fiches. Une tâche interférente consistant en un comptage à rebours d’une durée de 20 secondes est effectuée avant chaque RL. Chacun des trois RL est suivi d’un rappel indicé (RI) au cours duquel l’expérimentateur nomme la catégorie sémantique associée aux mots non évoqués en RL. Pour les deux premiers, l’examinateur doit donner la bonne réponse si le mot adéquat n’est pas retrouvé. Le dernier RI est suivi d’un compte à rebours de 20 secondes puis, d’une tâche de reconnaissance. Pour cette dernière, le participant doit identifier les 16 mots cibles parmi 32 distracteurs (16 distracteurs sémantiques et 16 distracteurs non reliés). Enfin, un délai de 20 minutes précède un RLD et un rappel indicé différé (RID).

Tâche des 15 mots de Rey

Après la lecture d’une liste de 15 mots non reliés entre eux (liste A), le participant doit rappeler le plus de mots entendus, dans l’ordre qu’il désire. La liste complète est répétée 5 fois et est toujours immédiatement suivie d’un rappel libre (RL). Après le dernier RL, l’examinateur procède à la lecture d’une liste d’interférence (liste B) comportant elle aussi 15 mots (non reliés à ceux de la liste A). La lecture de la liste B est suivie par un RL de cette même liste, puis par le RL de la liste A. Une fois ce dernier rappel effectué, le participant doit procéder à une reconnaissance immédiate des mots de la liste A dans un texte. Un délai de 30 minutes sépare la reconnaissance immédiate du rappel libre différé (RLD). Enfin, une tâche de reconnaissance classique (oui/non) dans laquelle les 15 mots de la liste A sont imbriqués dans une liste comportant 35 distracteurs (15 mots de la liste B, 8 mots sémantiquement liés aux mots de la liste A, 2 mots sémantiquement reliés aux mots de la liste B, 8 mots phonologiquement reliés aux mots de la liste A, 2 mots phonologiquement liés aux mots de la liste B) conclut l’épreuve.

Analyses statistiques

La comparaison des tests a été décomposée de la manière suivante : (1) courbes d’apprentissage, (2) rétention, (3) reconnaissance, fausses reconnaissances et intrusions, (4) effets plancher et plafond, et finalement (5) spécificité et sensibilité.

(1) Les courbes d’apprentissage des témoins et des patients DTA ont été comparées à partir des rappels libres 1, 2 et 3 du RL/RI 16 et des rappels libres 1, 3 et 5 du RAVLT. Ces derniers ont été choisis pour correspondre au début, milieu et fin de l’apprentissage2. Puisqu’il n’existe pas de condition de RI dans le test RAVLT, la comparaison des courbes d’apprentissage n’a tenu compte que des conditions de RL (figure 1). Une analyse de variance paramétrique (Anova) a été conduite sur les RL avec le groupe (personnes âgées saines vs. patients Alzheimer) et le test (RL/RI 16 vs. RAVLT) comme facteurs inter sujets et avec le temps de mesure (RL1, RL2, RL3) comme facteur intra sujet, les conditions d’applications des Anova étant respectées. (2) La rétention a été évaluée par une Anova avec le groupe (personnes âgées saines vs. patients Alzheimer) et le test (RL/RI 16 vs. RAVLT) comme facteurs inter sujets et avec le temps de mesure (RL3 vs. RLD) comme facteur intra sujet. (3) La reconnaissance et les faux souvenirs ont été comparés entre les tests grâce à la conversion des scores bruts sous forme de pourcentages. Le nombre d’intrusions, soit le nombre de mots faussement évoqués lors d’une condition de RL ou de RT, a été converti sous forme de pourcentage par la formule suivante : (nombre d’intrusions/nombre de mots produits (mots vrais + mots faux)) X 100. Quant à la reconnaissance, les formules suivantes ont été employées : pourcentage de reconnaissances vraies = nombre de bons mots identifiés par le participant/nombre de mots vrais à identifier X 100 et pourcentage de fausses reconnaissances = nombre de fausses reconnaissances par le participant/nombre de distracteurs X 100. Comme ces pourcentages ne suivent pas une distribution normale, les comparaisons entre les groupes et les tests ont été effectuées avec le test de Mann-Whitney. (4) Les effets plancher et plafond ont été examinés par l’analyse de la proportion des participants qui obtiennent le score maximal ou minimal à l’une des conditions des tests. (5) La sensibilité et la spécificité de chacun des tests ont été évaluées par des courbes ROC (Receiver operating characteristic) pour la condition RLD puisque ce score est reconnu comme le plus sensible [8].

Les effets d’interaction ont été décomposés en effets simples et analysés avec le test t de Student, non appariés pour comparer les tests entre eux, appariés pour comparer les différents rappels d’un même groupe. Une valeur de p inférieure à 0,05 a été définie comme seuil de significativité pour l’ensemble des tests.

Résultats

Les principaux scores obtenus par les groupes témoins et DTA au test du RL/RI 16 et du test RAVLT sont présentés dans le tableau 3.

Courbes d’apprentissage

L’analyse des courbes d’apprentissage montre un effet principal du groupe (F(1,75) = 177,97 ; p < 0,001) et du temps de mesure (F(2,150) = 73,65 ; p < 0,001) et du facteur test (F(1,75) = 5,98 ; p < 0,05). L’Anova indique également une interaction significative entre le temps de mesure et le groupe (F(2,150) = 35,09 ; p < 0,001), entre le temps de mesure et le test(F(2,150) = 34,87 ; p < 0,001). L’interaction entre le groupe et le test était tout juste significative (F(1,75) = 4,00 ; p = 0,049). Par contre, la double interaction entre le groupe, le test et le temps de mesure n’était pas significative (F(2,150) = 1,19 ; p = 0,31).

Les effets relatifs à chaque groupe ont été testés par une Anova (test X temps de mesure). Pour le groupe témoin, l’effet principal du test n’était pas significatif (F < 1), les participants rappelaient globalement autant de mots au test RAVLT qu’au RL/RI 16. En revanche, le facteur temps de mesure était significatif (F(2,76) = 83,44 ; p < 0,001). Les participants rappelaient de plus en plus de mots au fil des essais (RL1 < RL2 < RL3, p < 0,001). Finalement, l’interaction entre le test et le temps de mesure était également significative (F(2,76) = 13,47 ; p < 0,001). Cette interaction s’explique par le fait que les témoins évalués au RL/RI 16 rapportaient plus de mots au RL1 (p < 0,05), mais moins de mots au RL3 comparativement aux témoins évalués par le test RAVLT (p < 0,05). Cet avantage au test RAVLT disparaissait de nouveau pour le RLD où les performances entre les deux tests étaient de nouveau équivalentes (p = 0,37).

Pour le groupe DTA, le facteur test était significatif (F(1,37) = 14,27 ; p < 0,01), tout comme l’était le temps de mesure, (F(2,74) = 6,04 ; p < 0,001). Les patients DTA étaient globalement meilleurs au test RAVLT qu’à celui du RL/RI 16. L’interaction entre le test et le temps de mesure était également significative (F(2,74) = 25,65 ; p < 0,001). Le nombre de mots rappelés était similaire au premier rappel (RL1) entre les deux tests pour le groupe DTA (p > 0,05). Cependant, les performances s’amélioraient au fil des essais pour le test RAVLT (RL1 < RL2 < RL3, p < 0,05) alors qu’elles tendaient à se dégrader pour le RL/RI 16 entre le premier rappel (RL1) et le dernier (RL3, p < 0,05). Les autres comparaisons n’étaient pas significatives (p > 0,05). Rappelons cependant qu’il s’agit de rappels libres. Dans la condition indicée, on notait une amélioration du rappel total (RL + RI) d’essai en essai (RT1 < RT2 < RT3, p < 0,01).

Rétention

L’Anova pour la rétention révèle un effet principal du groupe (F(1,74) = 268,31 ; p < 0,001), et du temps de mesure (F(1,74) = 26,31 ; p < 0,001), et un effet tendanciel du facteur test (F(1,74) = 3,46 ; p < 0,07). L’analyse indique également une interaction significative entre le temps de mesure et le groupe (F(1,74) = 27,70 ; p < 0,001) et entre le temps de mesure et le test(F(1,74) = 49,54 ; p < 0,001). L’interaction entre le groupe et le test est quant à elle non significative tout comme la double interaction (F(1,74) < 1).

La décomposition des interactions indique que chez les témoins, le RLD était significativement meilleur que le RL3 au RL/RI 16, mais significativement moins bon au test RAVLT. Pour le groupe DTA évalué par le RL/RI 16, aucune différence n’était observée entre le RL3 et RLD (p > 0,05) alors que le nombre de mots rappelés au RLD était significativement inférieur à celui rappelé au RL3 pour le groupe DTA évalué au test RAVLT (p < 0,05). Les performances au RLD sont alors similaires entre les deux tests pour chacun des groupes (p > 0,05).

Reconnaissance et intrusions

Les données sont présentées dans le tableau 3. Les tests de Mann-Whitney indiquent que le pourcentage de bonnes reconnaissances était supérieur au test du RL/RI 16 comparativement au test RAVLT chez les témoins (W = 116, Z = - 2,99 ; p < 0,01) comme chez les patients DTA (W = 53, Z = 1,60 ; p < 0,01). Le pourcentage de fausses reconnaissances est quant à lui significativement plus important au test RAVLT par rapport à celui du test du RL/RI 16 chez les témoins (W= 269, Z = 2,56 ; p < 0,05), mais aucune différence n’est observée pour les patients DTA (W = 200, Z = 1,60, p = 0,11). Il est notable que la grande majorité des fausses reconnaissances commises au test RAVLT proviennent de mots issus de la liste d’interférence (68 % chez les témoins et 53 % chez les DTA).

Comme attendu, les individus des groupes témoins présentaient une meilleure reconnaissance que les patients DTA au RL/RI 16 (W = 74,5, Z = 3,45 ; p < 0,001) comme au test RAVLT (W = 18,5, Z = 4,89 ; p < 0,001). Les témoins commettaient également significativement moins de fausses reconnaissances que les patients DTA au RL/RL 16 (W = 256,5, Z = 3,77 ; p < 0,001) et au test RAVLT (W = 324,5, Z = 3,90 ; p < 0,001).

Les intrusions commises au test RAVLT étaient plus nombreuses que celles commises au RL/RI 16 chez les témoins (W = 392, Z = 5,33 ; p < 0,001) alors que l’inverse était observé chez les patients DTA (W = 67,5, Z = 3,12, p < 0,01). Là encore, les individus des groupes témoins produisaient moins d’intrusions que les patients DTA au RL/RI 16 (W = 277,5, Z = 3,57 ; p < 0,001) et au test RAVLT (W = 0, Z = 5,40 ; p < 0,001).

Effets plancher et plafond

Pour le RL/RI 16, aucun témoin n’obtenait un score parfait aux trois RL, et un seul témoin produisait les 16 mots au RLD. En revanche, dès le premier RT (RL + RI), 50 % des témoins obtenaient un score parfait. Cette proportion se maintenait au deuxième RT et augmentait à 85 % au troisième RT. Au RTD, 80 % des participants témoins obtenaient le score maximal. Il en était de même pour la condition de reconnaissance (95 % des participants témoins obtenaient le score maximal). Avec le RAVLT, aucun témoin n’obtenait le score maximal, sauf au dernier essai où deux des 20 témoins rapportaient tous les mots. En reconnaissance différée, un score maximal était observé chez 45 % des témoins.

La proportion de patients DTA au test du RL/RI 16 obtenant le score minimal (aucun mot rappelé) aux RL passait de 10 % au premier RL, à 25 % au 2e, puis à 30 % au 3e et à 60 % au RLD. Aucun participant n’obtenait le score minimal aux RT. Avec le RAVLT, aucun participant DTA n’obtenait le score minimal durant les cinq essais d’apprentissage, mais, au RLD, la proportion de DTA avec un score minimal (55 %) se rapprochait de celle observée avec le RL/RI 16.

Sensibilité et spécificité

Pour vérifier la sensibilité et la spécificité de chacun des tests en condition de rappel libre différé, des courbes ROC ont été établies (figure 2).

Au RL/RI 16, un score-seuil de 5 ou moins au RLD permet de classer les participants avec une sensibilité de 90 % et une spécificité de 100 % (AUC = 0,98 ; p < 0,001 ; IC 95% : 0,948-1,00). Toutefois, avec le même score seuil de 5 ou moins pour le test RAVLT, on obtient une sensibilité de 100 % et une spécificité de 100 % (AUC = 1.00 ; p < 0,001 ; IC 95% : 1,0-1,0). Au RAVLT, il n’existe aucun chevauchement entre les scores des participants des deux groupes.

Discussion

Cette étude visait la comparaison de deux tests de mémoire épisodique auprès de personnes âgées avec et sans trouble cognitif. Le RL/RI 16 fut développé plus tardivement que le test RAVLT et connaît une grande popularité dans les pays francophones. Il permet de différencier l’encodage, le stockage et la récupération. Cependant le test RAVLT reste couramment employé dans les milieux anglo-saxons et ses défenseurs soulignent sa meilleure sensibilité. Face à ces différences, il nous a semblé pertinent de confronter ces deux tests dans leur capacité à qualifier le fonctionnement mnésique des personnes âgées avec et sans démence.

Au premier abord, les deux tests semblent équivalents. Le nombre de mots rappelés entre le test RAVLT et RL/RI 16 ne différait pas significativement pour les groupes témoins. Les deux tests permettaient un apprentissage progressif des mots qui les composaient, puisque les personnes âgées sans trouble cognitif rappelaient de plus en plus de mots au fil des essais. Une amélioration au fil des essais était également observée pour les patients DTA au test RAVLT. Cependant, une première différence majeure apparaît au RL/RI 16 puisqu’une courbe d’apprentissage négative est observée pour les patients. Cette différence entre les tests pourrait être attribuable, d’une part, à l’apprentissage répété de la liste de mots et, d’autre part, à la présence d’un effet de récence au test RAVLT. Contrairement au RL/RI 16, aucun délai ne sépare le rappel de l’apprentissage ce qui favorise la production des derniers mots entendus. Cette hypothèse est soutenue par la diminution significative du nombre de mots rappelés entre le dernier RL et le RLD chez les individus évalués avec le RAVLT, diminution non observée chez ceux évalués avec le RL/RI 16. Le nombre de mots rappelés est alors comparable entre les deux tests. Le RL/RI 16 offrirait donc une vision plus juste de la rétention des mots en mémoire épisodique, alors que les rappels du test RAVLT refléteraient de surcroît les capacités de mémoire de travail [13, 14].

Il est également notable qu’une courbe d’apprentissage négative dans la DTA au RL/RI 16 a été rapportée par Ergis et al.[15]. Il est possible que la richesse de l’encodage initial, à la fois visuel et verbal, ait favorisé de manière disproportionnée le RL1. D’ailleurs, le RL1 du RL/RI 16 des personnes âgées saines était supérieur à celui du test RAVLT. Cependant, cet avantage disparaissait au fil des essais chez les témoins et le dernier rappel libre du test RAVLT devenait supérieur à celui du RL/RI 16, effet explicable par le fait que le dernier RL du test RAVLT correspond à la cinquième répétition de la liste. Cette diminution de l’avantage sémantique serait encore plus marquée pour les patients DTA, possiblement en raison d’une difficulté à l’encodage [2, 16] bien que ce résultat ne devrait pas être observé si précocement dans la maladie selon Tounsi et al.[16]. Cet encodage sémantique du RL/RI 16 semble toutefois favoriser la reconnaissance, tant chez les personnes âgées saines que chez les patients DTA qui présentent un meilleur pourcentage de reconnaissance que les individus évalués au test RAVLT.

Le groupe témoin présentait quant à lui très peu d’intrusions, mais ils en commettaient davantage au test RAVLT qu’au RL/RI 16. Il en allait de même pour les fausses reconnaissances. La principale explication de ce phénomène tiendrait à la nature des distracteurs employés. Le test RL/RI 16 ne présente que des distracteurs sémantiques et des distracteurs neutres, alors que le test RAVLT comporte des distracteurs sémantiques et phonologiques et surtout les mots de la liste interférente B. Ce sont particulièrement ces derniers qui sont faussement reconnus par les témoins bien que cette liste n’ait été présentée et mémorisée qu’une seule fois. Les processus mis en jeu dans la tâche de reconnaissance du test RAVLT demandent non seulement de reconnaître si le mot a déjà été présenté, mais aussi de se rappeler quelle était sa liste d’appartenance. Cette mémoire de source est de fait reconnue comme fréquemment affectée dans le vieillissement normal [17].

La reconnaissance au test RAVLT apparaît plus difficile que celle au RL/RI 16, notamment en raison de sa survenue 30 minutes après le dernier RL alors qu’elle est réalisée immédiatement après le troisième rappel au RL/RI 16. Le pourcentage de bonnes reconnaissances était d’ailleurs plus élevé au RL/RI 16 et un score maximal était atteint chez 95 % des témoins. Un effet plafond était aussi observé lors de la condition de RTD, ce qui appuie l’hypothèse que l’épreuve de RL/RI 16 est facilement réalisable chez des individus sans trouble cognitif. Cette trop grande facilité de la tâche constitue un désavantage lorsque vient le temps d’évaluer des personnes âgées pouvant présenter des troubles subtils de la mémoire en raison d’un manque de sensibilité (voir [2, 5] pour un avis contraire).

Les résultats ne mettent pas en avant d’effets plancher au RL/RI 16, pas plus qu’au test RAVLT, dans le groupe DTA. Ainsi, même si les mots à rappeler dans le test RAVLT n’étaient pas associés à aucun indice sémantique, les participants ne réussissaient pas moins bien la tâche. L’argument parfois avancé par des cliniciens d’une trop grande difficulté du test RAVLT ne semble donc pas corroboré par notre étude puisque le nombre d’items rapportés en RL3 est supérieur dans le RAVLT et similaire en RLD.

Finalement, même si le test RL/RI 16 présente une très bonne sensibilité et une excellente spécificité, le test RAVLT semblerait légèrement plus discriminant. En effet, les résultats obtenus au rappel différé n’indiquent aucun chevauchement entre les données des deux groupes de participants, ce qui en ferait un excellent outil de dépistage. Ces données sont en accord avec les résultats présentés par Seindenberg et al.[18] qui montrent que tous les participants obtenant un score de 5 ou moins au test RAVLT peuvent être considérés comme présentant une démence débutante avec une sensibilité et une spécificité de 100 %. Cette interprétation reste limitée par la petite taille de nos échantillons et mériterait une étude de plus grande envergure pour confirmer cette meilleure sensibilité.

Conclusion

Le but de cette étude était de comparer, auprès d’un échantillon homogène de participants âgés sans trouble cognitif et de participants atteints de DTA, les performances au test RAVLT et à l’épreuve du RL/RI 16. Les résultats obtenus indiquent que les deux épreuves sont relativement équivalentes auprès des personnes âgées sans trouble cognitif. Les différences apparaissent plus nettement lorsque ces tests sont utilisés auprès de personnes présentant des troubles de mémoire. Ainsi, le test RAVLT, bien que considéré comme étant plus difficile, semble offrir une meilleure sensibilité et spécificité que le test du RL/RI 16 dans le cadre de l’évaluation des troubles mnésiques dans la DTA. Le RL/RI 16 permettrait cependant d’obtenir une vision plus juste des capacités de rétention des participants, telles qu’évaluées par la différence de performance entre le dernier rappel libre et le rappel différé. Cette particularité ainsi que la moindre difficulté du RL/RI 16 en font un outil tout désigné pour le suivi des troubles mnésiques une fois ceux-ci établis. En outre, les résultats obtenus dans cette étude indiquent qu’une augmentation du nombre d’intrusions ainsi qu’une détérioration de la performance aux essais de RL pourraient constituer des indices importants à prendre en considération dans l’évaluation de personnes âgées pour détecter l’existence d’un trouble de mémoire. Les résultats de cette étude ne privilégient pas un test par rapport à l’autre, mais permettent plutôt de mettre en évidence les forces et les faiblesses de chacun des tests, permettant au clinicien averti de choisir l’un ou l’autre en fonction des caractéristiques mnésiques recherchées et des populations évaluées.

Points clés

  • Les tests de mémoire épisodique RL/RI 16 items et 15 mots de Rey (RAVLT) sont couramment utilisés en neuropsychologie, alors qu’ils présentent des différences méthodologiques importantes.
  • L’indiçage sémantique du RL/RI 16 entraîne des effets plafonds chez les personnes âgées saines pour les scores de rappels totaux. Le RAVLT semble plus difficile et la présentation d’une liste d’interférence au test RAVLT favorise les fausses reconnaissances chez les deux groupes.
  • Le RL/RI 16 refléterait plus fidèlement les capacités de rétention des participants en raison de sa méthodologie.
  • Le rappel différé du RAVLT offrirait une sensibilité et spécificité légèrement supérieures à celles du RL/RI 16 pour différencier les personnes âgées saines et les patients Alzheimer probablement en raison de sa plus grande difficulté (absence d’indice sémantique à l’apprentissage).
  • Le RAVLT pourrait être plus pertinent pour dépister des troubles mnésiques chez des individus sans perte fonctionnelle, alors que le test du RL/RI 16 permettrait une meilleure caractérisation des troubles mnésiques une fois ceux-ci établis.

Liens d’intérêts

Les auteurs déclarent ne pas avoir de lien d’intérêt en rapport avec cet article.


1 L’interférence rétroactive désigne le rappel de mots de la liste B (liste inférence) lors du rappel de la liste A. L’interférence proactive désigne le rappel de mots de la liste A lors du rappel de la liste B.

2 Une Anova a aussi été conduite sur les rappels libres utilisant les rappels 1, 2, et 3 du test RAVLT. Les résultats sont similaires à ceux trouvés pour les rappels 1,3,5. Le facteur Groupe est significatif, F(1, 75) = 148,58, p < 0,001, tout comme le facteur Temps de mesure, F(2, 150) = 40,83, p < 0,001. Le facteur test est non significatif (F<1). Toutes les interactions simples, ainsi que l’interaction double sont également significatives (p < 0,05).