ARTICLE
La qualité des analyses de biologie médicale dépend
de différents facteurs parmi lesquels le choix de la technique
et sa validation jouent un rôle très important. Il appartient
donc au biologiste de bien sélectionner ses outils et de justifier
objectivement ses décisions comme le rappelle le Guide de bonne
exécution des analyses de biologie médicale [1].
Ce souci ne peut être complètement satisfait en l'absence
de référentiel. Comment et sur quels critères décider
que la technique ou le système analytique utilisés sont
satisfaisants et peuvent être validés ?
Les résultats fournis doivent être suffisamment fiables
pour ne pas entraîner d'erreur d'interprétation dans le cadre
du diagnostic, du pronostic, de la surveillance, de la prévention,
du dépistage et de l'épidémiologie des maladies.
Objectifs
Le respect des règles d'assurance qualité des laboratoires
oblige à procéder à la validation des techniques
en préalable à leur utilisation et à le justifier.
Il s'agit d'un pré-requis indispensable dans le cadre de l'accréditation
des laboratoires. Cette opération s'effectue en deux étapes
: l'évaluation des performances de la technique suivie de leur
validation pour vérifier leur conformité à des normes.
Ces exigences sont réglementaires, mais le référentiel
permettant de définir les qualités souhaitables d'une technique
d'analyse n'existe pas. Le Guide de bonne exécution des analyses
de biologie médicale [1] indique (chapitre I.1) que «
c'est au biologiste qu'incombe le choix de méthodes optimisées,
utilisées dans un grand nombre de laboratoires et recommandées
par les sociétés scientifiques nationales ou internationales
de biologie ou, le cas échéant, validées par lui-même
à condition qu'elles permettent, dans la mesure du possible, le
transfert des résultats » et (chapitre III.1) que «
des procédures opératoires doivent être techniquement
validées afin d'assurer la qualité des résultats
».
La commission de validation de techniques de la SFBC avait proposé
en 1986 un protocole de validation accompagné de normes d'acceptabilité
[2] établies pour une vingtaine d'analytes. Ce protocole a été
largement utilisé et a permis un dialogue fructueux entre les différents
partenaires de la biologie médicale : biologistes entre eux, biologistes
et industriels, biologistes et cliniciens, biologistes et partenaires
administratifs. Il est apparu très vite que le nombre d'analytes
décrits dans ce document était insuffisant. C'est pourquoi
les initiateurs du premier projet ont souhaité rassembler un groupe
de travail, sous l'égide de la SFBC, pour réactualiser et
proposer des critères de validation dans un domaine plus étendu.
Le présent document permet la définition de normes d'acceptabilité
(limites de reproductibilité, de justesse et d'exactitude) pour
une centaine d'analytes et des niveaux de concentration pertinents choisis
pour correspondre le plus souvent à des niveaux de décision
médicale différents.
Définitions [3-6]
Chaque résultat de mesure est affecté d'une erreur totale
(inexactitude) qu'il convient d'identifier en recherchant ses composantes,
de qualifier et de quantifier. Les erreurs mises en évidence à
partir des résultats d'une évaluation sont la résultante
d'erreurs systématiques (erreur de justesse...) et d'erreurs aléatoires
(imprécision) auxquelles s'ajoutent des erreurs de spécificité
et des erreurs grossières.
La plupart des définitions sont issues des documents de l'Organisation
internationale de normalisation auxquels le lecteur peut se référer
(Afnor, Tour Europe, Paris-La Défense).
* Capabilité. La capabilité correspond à
la mesure établissant le rapport entre la performance réelle
d'un procédé et la performance demandée. Elle permet
de mesurer la capacité d'un procédé à réaliser
des pièces dans l'intervalle de tolérance fixé par
le cahier des charges. Une capabilité s'exprime par un chiffre
; un procédé est capable si ce chiffre est supérieur
à 1 ; en réalité le minimum de capabilité
exigé aujourd'hui est de 1,33 (par ex. : relation et répétabilité
entre reproductibilité).
* Critères d'acceptabilité. Ce sont les critères
selon lesquels les performances d'une technique sont jugées satisfaisantes
dans les conditions d'emploi définies par l'utilisateur. Ces critères
s'appuient en particulier sur les concepts d'imprécision, d'erreur
systématique et d'inexactitude (figure
1).
* Erreur systématique. C'est la différence entre
la moyenne qui résulterait d'un nombre infini de mesurages du même
mesurande, effectués dans des conditions de répétabilité
et une valeur vraie du mesurande. L'erreur systématique est égale
à l'erreur moins l'erreur aléatoire.
* Erreur de justesse. Il s'agit de l'erreur systématique
d'indication d'un instrument de mesure. Elle est normalement estimée
en prenant la moyenne de l'erreur d'indication sur un nombre approprié
d'observations répétées. Elle est aussi appelée
biais.
* Exactitude de mesure. Elle correspond à l'étroitesse
de l'accord entre le résultat d'un mesurage et une valeur vraie
du mesurande.
* Facteur d'élargissement. C'est le facteur numérique
utilisé comme multiplicateur de l'incertitude-type composée
pour obtenir l'incertitude élargie (1,96 pour un intervalle de
confiance de 5 % si le nombre de mesures est supérieur à
30).
* Incertitude type. Elle correspond à l'incertitude du
résultat d'un mesurage exprimée sous la forme d'un écart-type.
* Incertitude élargie. Parfois appelée incertitude
globale, c'est la grandeur définissant un intervalle, autour du
résultat d'un mesurage, dont on puisse s'attendre à ce qu'il
comprenne une fraction élevée de la distribution des valeurs
qui pourraient être attribuées raisonnablement au mesurande.
La fraction peut être considérée comme la probabilité
ou le niveau de confiance de l'intervalle (généralement
95 %).
* Incertitude-type composée. C'est l'incertitude type
du résultat d'un mesurage, lorsque ce résultat est obtenu
à partir des valeurs d'autres grandeurs, égale à
la racine carrée d'une somme de termes, ces termes étant
les variances ou covariances de ces autres grandeurs, pondérées
selon la variation du résultat de mesure en fonction de celle de
ces grandeurs.
* Mesurande. Il correspond à une grandeur particulière
soumise à un mesurage.
* Mesurage. Ce terme définit l'ensemble des opérations
ayant pour but de déterminer une valeur d'une grandeur.
* Répétabilité. Elle se définit comme
l'étroitesse de l'accord entre les résultats des mesurages
successifs du même mesurande, les mesurages étant effectués
dans la totalité des mêmes conditions. Elle est estimée
par les paramètres d'évaluation de la dispersion : ET (écart-type)
et CV (coefficient de variation).
* Reproductibilité. Elle se définit comme l'étroitesse
de l'accord entre le résultat des mesurages du même mesurande,
les mesurages étant effectués en faisant varier les conditions
de mesure. Elle est estimée par les paramètres d'évaluation
de la dispersion : ET et CV.
Champ d'application
Les spécifications et normes d'acceptabilité définies
sont liées à l'application du protocole de validation de
technique de la SFBC [2]. Elles varient en fonction de chaque analyse.
Elles sont rapportées pour les constituants sériques, plasmatiques,
sanguins et urinaires parmi les plus fréquemment mesurés
dans le domaine de la biochimie clinique et concernent les électrolytes,
les enzymes, les lipides, les protéines, les substrats, les métabolites,
les hormones, les marqueurs tumoraux, les gaz du sang et les médicaments.
Ces critères sont destinés aux biologistes dans leur pratique
de validation des performances des techniques utilisées et aux
organismes compétents qui effectuent des expertises lors de l'évaluation
ou de la validation de nouveaux réactifs, techniques ou systèmes
analytiques, mais aussi aux industriels dans les différentes phases
du développement de nouveaux produits.
Les différentes approches de détermination
des normes d'acceptabilité
La variabilité des résultats d'une analyse inclut les
facteurs de variations :
- pré-analytiques dus, par exemple, à la technique de
prélèvement, à la durée de stockage, aux conditions
de prétraitement du spécimen, etc. ;
- analytiques engendrés par l'imprécision et le biais
;
- biologiques physiologiques (intra- et/ou inter-individuelles).
Les normes d'acceptabilité varient en fonction de l'analyse considérée
et peuvent être exprimées en termes de limites d'erreur de
reproductibilité, limites d'erreur de justesse et de limites d'erreur
d'exactitude.
Différents critères de jugement ont été
utilisés pour établir des spécifications en matière
de performance analytique. Elles reposent sur différentes approches
: l'intervalle des valeurs de référence (prise en compte
de la variation biologique interindividuelle et de la variation analytique),
les variations biologiques interindividuelles et intra-individuelles,
l'opinion des cliniciens et l'état de l'art.
Intervalle de référence
Les qualités d'une technique de dosage doivent être telles
qu'elles lui permettent de distinguer un résultat « normal
» d'un résultat pathologique. Les techniques devront, de ce
fait, présenter une précision d'autant plus grande que l'intervalle
des valeurs de référence est étroit. Certains auteurs
[7] estiment que les limites tolérables d'erreur (2 CV analytiques)
en termes de pourcentage doivent être inférieures à
:
1/4 intervalle de référence x 100
moyenne de l'intervalle de référence
Cette approche est simple - les valeurs de référence existent
pour toutes les analyses - elle est donc toujours applicable. Cependant
la valeur 1/4 est donnée de façon arbitraire et les valeurs
données pour l'intervalle de référence dépendent
de la population étudiée, de la technique statistique utilisée
et des performances analytiques de la technique.
Variations biologiques intra-individuelles
De façon à mettre en évidence des variations anormales
chez un même individu, ou par rapport à un groupe d'individus
choisis comme référence, il faut disposer d'une technique
dont la reproductibilité est inférieure à la variation
biologique. Par exemple, certains auteurs ont proposé que l'imprécision
analytique acceptable, exprimée en termes de coefficient de variation,
soit inférieure à la moitié du coefficient de variation
observé pour la variation biologique intra-individuelle [8-15].
C'est une approche dont le modèle est simple et en relation avec
la physiopathologie, mais la fraction 1/2 est totalement arbitraire. Cette
approche conduit très souvent à des spécifications
plus strictes que celles qui peuvent être obtenues avec les techniques
actuelles disponibles et, de ce fait, ne peut être considérée
que comme un objectif à long terme. Elle peut également
conduire à des exigences très larges par rapport aux possibilités
des techniques actuelles dont la reproductibilité est très
performante pour certains analytes pour lesquels il existe de très
grandes variations intra-individuelles. Aussi, les partisans de ce type
de détermination [8] proposent-ils de choisir les normes à
partir des données de l'état de l'art dans les cas où
les limites déterminées en fonction des variations intra-individuelles
« trahissent l'état de l'art ». Ces auteurs proposent
également que soient définies des spécifications
pour l'erreur systématique acceptable en appliquant la formule
:
ES = (check)(CV2 intra-individuel + CV2
inter-individuel)
Les normes proposées sur ce schéma diffèrent, pour
un grand nombre d'analyses, des normes d'acceptabilité adoptées
par les autorités responsables des programmes d'évaluation
externe de la qualité dans les différents pays [6, 13].
Opinions des cliniciens
Les exigences des cliniciens varient en fonction de l'objectif clinique.
L'estimation et l'interprétation formulée par le clinicien
tient compte non seulement de la variation analytique, mais aussi de la
variation biologique. Elles sont générées par des
informations rapportées à des changements se produisant
dans des situations cliniques bien définies. Ces changements ne
sont pas seulement dus à des variations analytiques, mais résultent
également des variations pré-analytiques. Les exigences
des cliniciens varient avec leur spécialisation [17], leur cursus,
leur expérience, leurs conditions d'exercice et, de plus, en fonction
des performances des laboratoires avec lesquels ils travaillent habituellement.
Elles sont donc variables et, de ce fait, très peu transférables.
État de l'art
L'état de l'art représente les performances analytiques
obtenues, à un moment donné, dans un certain nombre de laboratoires.
Il est, en général, établi à partir des résultats
des programmes de contrôle de qualité intra et/ou interlaboratoires.
Le niveau de performance atteint par un certain nombre de laboratoires
parmi ceux qui fournissent les meilleurs résultats (20 à
50 % des laboratoires selon les auteurs) pourrait constituer un objectif
à atteindre pour tous [16].
C'est une approche pragmatique et facile à définir à
condition que les spécimens de contrôle utilisés se
comportent comme des spécimens « biologiques ». Un exemple
est donné dans le tableau
1 correspondant aux normes établies avec chacun des critères
destinés à définir les normes d'acceptabilité
pour le dosage du calcium.
Le groupe de travail a retenu globalement le critère de l'état
de l'art pour établir les normes publiées en 1986. Ces normes
ont été largement utilisées pendant plus de 10 ans
pour les évaluations de réactifs ou d'appareils réalisées
en France [2, 18, 19]. La même approche a été adoptée
pour établir les normes proposées dans le présent
document.
Stratégie adoptée
pour définir les spécifications
1. Établissement d'une liste d'analyses pour lesquelles des données
sont disponibles (tableau 2).
2. Choix des critères à retenir et définition des
modes de calcul.
3. Recueil de données provenant des différentes expériences
des membres du groupe responsable d'associations de contrôle de
qualité : Asqualab (Paris), CTCB (Toulouse), Probioqual (Lyon).
4. Recueil des données provenant des expériences d'évaluation
externe de la qualité effectuées sur le plan national.
5. Confrontation des données des différents membres du
groupe et consensus.
6. Évaluation interne des valeurs définies et modifications.
7. Diffusion du projet.
8. Re-évaluation des limites.
Critères proposés
La liste des spécifications retenues pour les analyses définies
est présentée dans le tableau
3. Elle correspond à une proposition de limites acceptables
d'erreur de reproductibilité, d'exactitude et de justesse.
* Nom de l'analyse
* Unité. Le système international est privilégié.
Les unités conventionnelles sont également utilisées
lorsqu'elles sont les plus pratiquées.
* Domaine de mesure (en unité). Donné à
titre indicatif, il correspond à l'étendue de la zone de
linéarité des techniques habituellement utilisées.
* Valeurs usuelles (en unité). Données à
titre indicatif, elles correspondent aux valeurs les plus souvent rencontrées
avec les techniques les plus courantes chez les adultes ou à la
zone thérapeutique dans le cas du dosage des médicaments.
* Niveaux de concentration ou d'activité (en unité).
Ils sont choisis pour se situer à des niveaux de décision
clinique d'une part, être représentatifs de l'étendue
du domaine de mesure d'autre part. Ainsi, le plus souvent ils correspondent
à trois niveaux distincts, le premier se situant à une concentration
proche de la limite basse des valeurs usuelles (B), le second à
une valeur proche de la limite haute des valeurs usuelles (M) et le troisième
à la limite haute de linéarité de la technique (E).
Ils sont destinés au choix des préparations de contrôle,
à la définition des valeurs limites acceptables pour chacun
des trois niveaux définis.
* Intervalle de variation (en pourcentage). Il correspond à
l'intervalle de concentrations possibles pour le choix des spécimens
de contrôle par rapport aux valeurs rapportées dans le paragraphe
5.
* Répétabilité (estimée par le CV
exprimé en pourcentage). Le CV limite de répétabilité
a été calculé à partir de la valeur du CV
limite donnée pour l'évaluation de la reproductibilité,
en appliquant la formule :
reproductibilité = 1,33 répétabilité
soit, répétabilité = reproductibilité/1,33
CV répétabilité = CV reproductibilité x
0,75
* Reproductibilité (estimée par le CV exprimé
en pourcentage). Le CV limite pour chaque niveau de concentration est
défini (état de l'art) à partir des CV obtenus par
les 50 % de laboratoires les plus performants parmi les participants aux
différents programmes de contrôle de qualité intra/interlaboratoire.
* Justesse (en pourcentage) = erreur systématique. Elle
est calculée à partir de la formule :
erreur de justesse (en %) = (check)(erreur d'exactitude en %)2
- (CV % reproductibilité)2
* Inexactitude (en pourcentage). Elle est la résultante
de l'erreur systématique et de l'erreur aléatoire : lors
de son utilisation, il faut tenir compte du facteur d'élargissement,
c'est-à-dire de multiplier par 2 la limite donnée dans le
tableau 3 (pour un risque
de 5 %). Ainsi utilisée, elle permet de juger de la qualité
des résultats obtenus par les participants à différents
contrôles ponctuels effectués en France.
* Normes de suivi (NS) (en unité). Elles sont destinées
à permettre la détection des spécimens déviants
lors de la comparaison de techniques, c'est-à-dire des résultats
qui présentent une erreur supérieure à l'erreur de
reproductibilité, démontrant qu'il ne s'agit pas d'une erreur
aléatoire. Elles sont calculées pour chaque niveau de concentration
par la formule :
NS = (check)(3 ET reproductibilité technique testée)2
+ (3 ET reproductibilité technique comparée)2
= 4,24 x ET (reproductibilité)
en supposant que CV1 = CV2 (CV du même
ordre pour les deux techniques).
* Normes d'interprétation de la droite de régression
[18, 19]. Elles correspondent, pour chaque niveau de concentration défini,
aux erreurs systématiques maximales tolérables.
NI = (limite d'erreur de justesse systématique x 2 x niveau B,
M, E).
Le terme x 2 correspond au facteur d'élargissement pour un risque
de 5 %.
* Répartition des spécimens de patients en fonction
de leur niveau de concentration [18, 19]. Pour le choix des spécimens
de patients destinés à être mesurés par la
technique testée et la technique de comparaison lors de la comparaison
de techniques, il est important de respecter une répartition régulière
en fonction de la concentration. Cette répartition est facilitée
par la définition de quatre classes de concentration. Elle est
donnée, à titre indicatif dans le tableau
4 pour chacune des analyses sélectionnées.
CONCLUSION
Ce référentiel est destiné à ceux qui effectuent
des évaluations de techniques pour juger de leur qualité
et les valider en fonction de leur reproductibilité, et de leur
justesse en comparant les résultats avec ceux d'une technique choisie
comme référence. Pour chaque analyte et chacun des trois
niveaux de concentration des préparations de contrôle à
utiliser pour une évaluation, des spécifications de répétabilité,
de reproductibilité, de justesse (erreur systématique) et
d'exactitude sont définies en suivant un protocole commun.
Ces spécifications s'appliquent à la fois aux résultats
obtenus avec les préparations de contrôle et avec les spécimens
biologiques provenant de patients. Ces données sont utilisables
essentiellement dans le cadre de l'application du protocole de validation
de techniques de la SFBC et permettront de mettre à la disposition
des biologistes et des organismes compétents des critères
objectifs de qualité destinés au choix et à la validation
des dispositifs utilisés en biologie clinique.
Ce processus de validation s'intègre dans une démarche
d'évaluation globale de la qualité d'une technique d'analyse,
de la définition de sensibilité et spécificité
cliniques dans le cadre du diagnostic, de la prévention, de la
surveillance, du pronostic, de la prévention et de l'épidémiologie
des maladies. Ces normes peuvent être utilisées dans les
laboratoires comme critères d'évaluation des résultats
du contrôle de la qualité des analyses (interne et externe).
Ce référentiel est un outil qui doit évoluer et
constitue un élément de dialogue propice au développement
du partenariat entre biologistes et cliniciens, biologistes et industriels.
À titre d'exemple, la définition des critères de
qualité pour le dosage de l'acide urique, comparé à
ceux proposés en 1986 est présenté dans le tableau
5.
Les biologistes sont invités à donner leur avis, à
susciter des discussions et enrichir de leur expérience les données
présentées.
Article reçu le 19 juin 1999, accepté le 10 août
1999.
REFERENCES
1. Guide de bonne exécution des analyses de biologie médicale.
Décret du 2 novembre 1994, Journal officiel, 4 décembre
1994.
2. Vassault A, Grafmeyer D, Naudin C, et al. et les membres
de la commission Validation de techniques de la SFBC. Protocole de validation
de techniques (Document B). Ann Biol Clin 1986 ; 44 : 686-745.
3. Vassault A, Dumont G, Labbé D. Définitions des
critères de qualité d'une méthode d'analyse. Le
Moniteur Internat 1992 ; 26, 20-33.
4. Organisation internationale de normalisation : ISO (1993).
Vocabulaire international des termes fondamentaux et généraux
de métrologie. Suisse.
5. Organisation internationale de normalisation : ISO (1995).
Guide pour l'expression de l'incertitude de mesure.
6. Mollard JF, Naudin C, Dumont G, Vassault A, Azzedine MC, Bailly
M et les membres de la commission Validation de techniques de la SFBC.
Dictionnaire des termes à l'usage de la validation de techniques
(glossaire). Ann Biol Clin 1986 ; 44 : 679-85.
7. Tonks DB. A study of the accuracy and precision of clinical
chemistry determinations in 170 Canadians laboratories. Clin Chem
1963 ; 9 : 217-33.
8. Fraser CG, Hyltoft Petersen P, Ricos C, Haeckel R. Proposed
quality specifications for the acceptability of analytical systems for
clinical chemistry. Eur J Clin Chem Clin Biochem 1992 ; 30 : 311-7.
9. Williams GZ, Young DS, Stein MR, Cotlove E. Biological and
analytic components of variation in long-term studies of serum constituents
in normal subjects. I. Objectives, subject selection, laboratory procedures
and estimation of analytic deviation. Clin Chem 1970 ; 16 : 1016-21.
10. Harris EK, Kanofsky P, Shakarji G, Cotlove E. Biological
and analytic components of variation in long. Clin Chem 1970 ;
16 : 1022-7.
11. Cotlove EH, Harris EK, Williams GZ. Biological and analytic
components of variation in long-term studies of serum constituents in
normal subjects. III. Physiological and medical implications. Clin
Chem 1970 ; 16 : 1028-32.
12. Harris EK. Statistical principles ubderlying analytic goal-setting
in clinical chemistry. Am J Clin Pathol 1979 ; 72 : 374-82.
13. Stöckl D. European specifications for imprecision and
inaccuracy compared with US CLIA proficiency-testing criteria. Clin
Chem 1995 ; 41 : 120-1.
14. Barnett RN. Medical significance of laboratory results. Am
J Clin Pathol 1968 ; 50 : 671-6.
15. Skendzel LP, Barnett RN, Platt R. Medically useful criteria
for analytical performance of laboratory tests. Am J Clin Pathol
1985 ; 83 : 200-5.
16. Westgard JO, Bawa N, Ross JW, Lawson NS. Laboratory precision
performance. State of the art versus operating specifications that
assure the analytical quality required by clinical laboratory improvement
amendments proficiency testing. Arch Pathol Lab Med 1996 ; 120
: 621-5.
17. Elion-Gerritzen WE. Analytical goals in clinical chemistry
and medical decision. Am J Clin Pathol 1980 ; 73 : 183-95.
18. Eynard JC, Grafmeyer D. Protocole Validation de techniques.
Exploitation des données par le logiciel Mac Valtec. Inf Sci
Biol 1987 ; 13 : 216-7.
19. Vassault A, Baud M, Castagnier M, et al. Commission
Validation de techniques de la SFBC et groupe de travail SFBC/Corata «
Comparaison de Techniques ». Recommandations pour la comparaison
de techniques. Ann Biol Clin 1992 ; 50 : 727-30.
|