ARTICLE
Pas de placebo : UKPDS est donc une étude « ouverte »
La première étude clinique randomisée dans le traitement du DNID a commencé en
1960. Elle se nommait UGDP (University Group Diabetes Program) [1]. Elle
fut arrêtée après 10 ans de suivi en raison d'une surmortalité cardiovasculaire
chez les patients traités par tolbutamide (sulfamide hypoglycémiant), et par phenformine
(biguanide). Cette étude a été sujette à de nombreuses controverses (qualité de
réalisation de l'étude, aspects méthodologiques...) qui ne sont pas l'objet de
notre article. Mais malgré les critiques qui lui ont été adressées et qui pour
certaines étaient justifiées, les résultats de l'UGDP sont d'un meilleur niveau
de preuve que ceux d'UKPDS. En effet, contrairement à UKPDS, UGDP comportait un
groupe de comparaison traité par placebo.
En l'absence de groupe traité par placebo, comment peut-on attribuer la différence
entre deux groupes de patients recevant des traitements actifs à une différence
d'efficacité ? Elle peut être tout aussi bien liée à une différence de iatrogénie.
Étant donné la toxicité des antidiabétiques oraux suggérée par l'UGDP, l'inclusion
d'un groupe traité par placebo était indispensable pour interpréter de manière
correcte une différence entre les deux groupes.
De plus, les biais liés à l'absence de groupe placebo et donc à l'absence d'insu
sont bien connus et d'une importance majeure, en particulier si les investigateurs
sont convaincus du bienfait des traitements. Si l'absence de double insu pose
peu de problème pour le critère « mortalité toute cause », en revanche, elle
risque de laisser un biais s'installer dans le diagnostic des autres critères
cliniques, comme la mortalité cause spécifique ou les complications macrovasculaires.
Et surtout, cela a bien pu fausser les décisions de photocoagulation rétinienne
par les ophtalmologues informés du mauvais contrôle glycémique des patients
dans le groupe traité moins intensivement (stratégie « conventionnelle »). Par
« précaution » médicale, ces patients ont pu être davantage traités. Quand on
sait que c'est principalement ce critère de jugement qui diffère entre les deux
stratégies et qui rend significatif sur le plan statistique le critère de jugement
principal combiné, on ne peut qu'être dubitatifs comme le sont McCormack et
al. [2].
L'importance de ce biais dans une étude ouverte peut être relativisée si un
comité d'évaluation des événements cliniques indépendant des investigateurs
établit les diagnostics « à l'aveugle ». Mais dans les publications concernant
UKPDS, il n'est jamais précisé qu'un tel comité a fonctionné selon cette règle.
Procédure de randomisation insuffisamment décrite
Étant donné l'absence d'insu, la randomisation (allocation aléatoire des traitements)
est la seule procédure pouvant garantir la comparabilité initiale des groupes.
Encore faut-il qu'elle corresponde à un processus réellement imprévisible de part
des investigateurs. C'est la raison pour laquelle les méthodologistes insistent
sur la qualité et sur la méthode de cette randomisation, et donc de la description
dans la publication au chapitre « méthodes » du type de randomisation. Cela permet
d'évaluer le caractère adéquat ou non de la procédure [3]. En effet, la séquence
d'attribution à un groupe de l'étude (allocation) doit être imprévisible
et rester cachée (concealment) pour les investigateurs qui incluent les
patients dans l'étude. Le caractère « randomisé » d'un essai clinique n'est évaluable
et ne peut donc être déclaré fiable que si une information précise et complète
est disponible dans le paragraphe décrivant la méthodologie. Pour UKPDS, nous
ne disposons pas de ce type d'information. L'étude peut être considérée comme
« quasi randomisée ». Schulz [4] et Kunz [5] estiment que l'absence de secret
concernant la séquence de randomisation peut surestimer les résultats de 40 %
!
L'importance d'une procédure correcte de randomisation est confirmée par une
approche différente des facteurs du niveau de preuve des résultats d'un essai
clinique mais est placée au second plan derrière le double insu et le placebo
[6].
Analyse statistique finale discutable
Sa stratégie laisse des pans entiers dans l'ombre
D'une manière générale, il existe une discordance entre le plan d'expérience initial
tel qu'on a pu le comprendre, les questions posées au départ et les analyses statistiques
publiées. En effet, le plan initial était composé de deux strates avec quatre
bras dans la strate « absence de surcharge pondérale » et cinq bras dans la strate
« présence de surcharge pondérale ». Dans UKPDS 33, les analyses statistiques
seront conduites comme si l'essai était à deux bras : stratégie « intensive »
versus « conventionnelle » sans tenir compte du surpoids des patients alors que
le plan expérimental était bien prévu pour distinguer l'efficacité des stratégies
selon le poids des patients (comme en témoigne la randomisation stratifiée et
les précédentes publications [7, 8]. La figure 4 (p. 843) [9] présente sept tests
statistiques pour les critères composites principaux. Les effectifs des différents
bras thérapeutique (sulfamides, insuline) sont mélangés puis analysés de façon
séparée (figure 5 UKPDS 33).
Pour les patients en surpoids, seules certaines analyses sont publiées (UKPDS
34 et la metformine).
Le seuil de signification statistique a changé au cours de l'étude
En 1987, soit 10 ans après le début de l'étude, il n'existe aucune différence
statistique entre le traitement intensif et le traitement conventionnel au risque
alpha de 1 % et avec un effectif calculé pour une puissance statistique de 81
%. Les auteurs revoient donc leur effectif à la hausse pour augmenter la puissance
des comparaisons (inclusion de 826 sujets supplémentaires) en augmentant le risque
alpha à 5 % pour les critères principaux composites (clinical endpoint aggregates)
et conservant un risque alpha à 1 % pour les critères secondaires simples.
Il est donc intéressant de constater que la différence entre le traitement
intensif et le traitement conventionnel observée à la fin de l'étude (p = 0,029)
(figure 4 d'UKPDS 33, p. 843) n'est significative que pour ce deuxième seuil
de 5 % ! De la même manière, les résultats positifs observés avec la metformine
dans UKPDS 34 (figure 10) [10] peuvent se lire avec ce changement de seuil :
les réductions de la mortalité totale et d'origine diabétique ne sont significatives
qu'au seuil de 5 % et non au seuil de 1 % (respectivement p = 0,017 et p = 0,011).
Il ne resterait alors qu'un seul critère significatif : celui du critère « toute
complication d'origine diabétique » (p = 0,0023) incluant en fait tous les autres
critères dont les complications microvasculaires et posant les habituels problèmes
d'interprétation des critères composites (cf. paragraphe 5).
En principe, le risque alpha doit être choisi dès le début de l'étude et non
pas être modifié en fonction des analyses statistiques.
Quelle significativité statistique accorder aux résultats publiés ?
Un autre problème de taille est bien évidemment celui des analyses multiples et
de l'inflation du risque alpha qui n'a pas été prise en compte. Un seuil de 5
% a été choisi pour les trois critères principaux composites et aussi pour les
quatre critères simples (infarctus du myocarde, accident vasculaire cérébral,
amputation ou décès par maladie vasculaire périphérique, complications microvasculaires).
Un seuil de 1 % a été choisi pour les autres critères simples.
Pour UKPDS 33 [9], ces analyses multiples liées aux analyses intermédiaires
répétées mais aussi à la multiplicité des critères de jugement (28 au total)
permettent de dégager 5 tests significatifs sur 112 ! Il y a 3 tests significatifs
sur 28 pour les comparaisons « stratégie intensive » versus « stratégie
conventionnelle » et 2 tests significatifs sur 84 (figure 5) pour les comparaisons
selon les différents bras thérapeutiques (chlorpropamide, glibenclamide et insuline).
Or le seul hasard entraînerait en moyenne 5 tests significatifs à 5 % et 1 test
significatif à 1 % sur 100 tests réalisés...
À cet égard, on peut observer qu'un traitement par insulinothérapie « intensive
» pendant 11 ans n'a permis de diminuer qu'un seul critère de jugement : la
photocoagulation rétienne (et pas les autres critères, y compris ophtalmologiques)
; et cela avec les nombreuses réserves sur la valeur de ce critère. Comment
affirmer encore que l'insulinothérapie est efficace de façon certaine dans le
traitement du diabète de type 2 ?
Critères de jugement
Dans UKPDS, il n'y a pas un critère de jugement principal mais trois : deux critères
composites (any diabetes-related endpoint et diabetes related death)
et un critère simple et fiable (all cause mortality). Cela est problématique
car le risque d'erreur alpha a été choisi pour un seul critère. Cela entraîne
une augmentation du nombre de tests statistiques et donc de la probabilité d'erreur
alpha (de première espèce).
Ensuite, les deux critères composites sont extrêmement problématiques dans
la mesure où ils mélangent des événements cliniques qui n'ont pas la même importance
pour les patients (mortalité et photocoagulation rétinienne) et pas du tout
la même fiabilité. C'est le cas pour UKPDS 33 [9] : seul le critère « photocoagulation
rétinienne » est significatif, et explique ainsi que le critère « complications
microvasculaires » puis « toutes complications liées au diabète » sont à leur
tour significatifs (tableau 1)
! Notre analyse post hoc des données d'UKPDS 33 montre bien que sans les événements
« photocoagulation rétinienne », la différence pour le critère any diabetes-related
endpoint n'est plus significative (tableau
2).
Toute l'efficacité d'une
stratégie intensive du contrôle glycémique (RR = 0,88 ; p = 0,029) est en fait
liée à l'efficacité sur ce critère de jugement de photocoagulation rétinienne
(RR = 0,71 ; p = 0,0031).
On notera que ce critère de jugement n'était pas mentionné dans la publication
de 1983 [11] et de 1981 [12] et qu'il apparaît la première fois dans l'article
de 1991 [13]. D'autre part, il est d'autant plus problématique qu'il est fondé
sur une décision médicale dans une étude ouverte et qu'il est bien moins pertinent
que celui de rétinopathie diabétique et que celui de cécité.
Bien entendu, ce qui sera affirmé après UKPDS, c'est que l'on dispose de la
preuve qu'une stratégie intensive du contrôle glycémique diminue de 12 % toutes
complications d'origine diabétique [12, 14].
Or, on sait bien les problèmes que posent ces critères composites [15]. Aujourd'hui,
ces deux critères composites ne devraient pas être acceptés car ils regroupent
des événements cliniques de signification très différente [16]. Pourtant, le
même problème existe toujours dans l'étude récente ADVANCE [17] où la signification
statistique du critère principal est liée à la seule diminution de la micro-albuminurie...
Biais de suivi
Compte tenu de la durée du suivi et le caractère ouvert de l'étude, il aurait
été important de s'assurer que la comparabilité des groupes avait été maintenue
tout le long de l'étude. Est-ce que l'adhérence au régime alimentaire était identique
[18] ? Est-ce que la prise en charge des facteurs cardiovasculaires étaient identique,
en particulier, pour la prise de traitement antihypertenseurs, statines ou antiagrégants
plaquettaires ? Par exemple, il est noté que les sujets traités intensivement
par la chlorpropamide avaient une pression artérielle plus élevée en moyenne que
ceux du groupe conventionnel. Or nous ne disposons à aucun moment de données concernant
la prise d'autres traitements ! Ce point est primordial dans la mesure où une
étude emboîtée portant sur l'évaluation des traitements antihypertenseurs dans
le DNID a été conduite chez certains patients d'UKPDS [19]. On ne saura jamais
si ces traitements associés étaient répartis de façon identique entre les groupes.
Quand on sait que le contrôle de la pression artérielle peut diminuer les complications
macro et même microvasculaires du DNID [19], on peut se demander si les résultats
observés dans UKPDS 33 et 34 ne pourraient pas être liés à ces traitements associés
et non à la stratégie intensive du contrôle glycémique...
Surmortalité dans le groupe sulfamides + metformine
La manière dont la surmortalité observée dans le groupe des patients en surpoids
et traités par l'association sulfamides + metformine versus sulfamides
en monothérapie (UKPDS 34, p.863 figure 10) est présentée dans la publication
nous permet d'approfondir nos critiques. On notera que l'Hba1c était de 7,7 %
dans le 1er groupe versus 8,2 % dans le second, soit une différence
de 0,5 % d'Hba1c.
Quels sont les résultats ? Pour le critère de jugement « mortalité toute cause
» : RR = 1,6 (p = 0,041) ; pour celui de « décès liés au diabète » : RR = 1,
96 (p = 0,039). Comme on le voit, les RR sont significatifs « nominalement »
(c'est-à-dire sans tenir compte de la multiplicité des tests réalisés) au seuil
alpha de 5 %, et non significatifs au seuil alpha de 1 %. Il est donc fortement
probable que ces résultats soient liés au hasard (voir la discussion des conséquences
de la multiplicité des tests ci-dessus).
Mais les auteurs se gardent bien d'analyser ce résultat gênant en posant la
question des choix du seuil de signification, car dans ce cas, ils devraient
remettre en cause tous les autres résultats « positifs » favorables aux traitements
pharmacologiques. En effet, si l'on accepte cette explication d'un résultat
lié au hasard et que l'on récuse l'idée que la metformine associée à un sulfamide
accroît la mortalité, il faut aussi l'accepter pour l'efficacité de la metformine
et pour l'efficacité du traitement « intensif ». Au lieu de cela, les auteurs
précisent qu'ils ont conduit une méta-analyse et une analyse épidémiologique
pour démontrer l'absence de risque de l'association sulfamide/metformine. Les
résultats de ces 2 analyses n'ont jamais été publiés.
De même, ils ne discutent pas le fait que ces résultats apparaissent avec une
Hba1C plus basse (7,7 % contre 8,2 %) dans le groupe où l'on observe la surmortalité.
Dans une démarche scientifique, on pourrait au minimum conclure que « l'idéologie
» du contrôle glycémique (« plus l'Hba1c est basse, mieux c'est ») doit être
discutée.
Enfin, étant donné le risque potentiellement iatrogène de cette association,
il aurait été important de connaître le nombre de patients dans chaque groupe
qui l'ont reçu. En effet, une répartition asymétrique pourrait expliquer les
différences observées, non pas par plus d'efficacité d'une stratégie par rapport
à une autre mais par moins de iatrogénie.
D'un point de vue sociologique, il est « amusant » de constater que la communauté
médicale n'a retenu que l'efficacité de la metformine et du traitement intensif,
mais pas ce surrisque, alors que les niveaux de preuves étaient similaires.
La metformine est-elle vraiment efficace ?
Avec tous les problèmes que nous avons mis en évidence, et avec les résultats
de l'étude HOME [20], comment affirmer encore que la metformine est sans ambiguïté
le médicament le plus efficace dans la prévention des complications liées au diabète
de type 2 ? UKPDS ne visait pas à le démontrer comme l'atteste l'absence de groupe
traité par placebo et l'absence de double insu...
Seul un essai randomisé contrôlé contre placebo et en double insu pourrait
démontrer l'efficacité spécifique de la metformine. Cet essai n'aura sans doute
jamais lieu tant les médecins sont convaincus de l'efficacité de la metformine.
On pourra toujours prétexter le caractère non éthique d'une telle étude. Mais
il faut bien se rendre à l'évidence : le niveau de preuve de l'efficacité de
la metformine reste très faible. Ce n'est pas la méta-analyse de Selvin et
al. [21] qui peut nous rassurer dans la mesure où le poids d'UKPDS 34 est
largement prépondérant...
Conclusion
UKPDS 33-34 est une étude de faible niveau de preuve malgré son caractère randomisé.
Pour le moment, ses résultats ne sont pas confirmés par une autre étude. Elle
nous donne l'illusion que nous savons ce que nous faisons en matière de thérapeutique
dans le diabète de type 2. Or, ses lacunes et nombreux biais potentiels relativisent
ses résultats. Ils sont loin d'être aussi spectaculaires qu'on a bien voulu le
croire. Il est étonnant de constater qu'ils sont cités « en boucle » sans précaution
et acceptés par la communauté médicale y compris dans les journaux de la médecine
factuelle (EBM) [14]. Étant donné les biais majeurs d'UKPDS 33-34, les résultats
de l'étude UKPDS-35 [22] comme le suivi à 10 ans publié récemment [23] sont également
problématiques.
Il serait intéressant que cette étude soit proposée aux étudiants qui passent
l'Examen Classant National. Peut-être découvriraient-ils alors que le traitement
du diabète de type 2 ne repose pas sur des essais contrôlés de bonne qualité
et que la médecine factuelle n'est pas encore une réalité en 2009. En ce sens,
l'étude UGDP [1], malgré ses propres imperfections, peut être considérée comme
d'un meilleur niveau de preuve que l'UKPDS.
Pourquoi donc la communauté médicale n'a-t-elle retenu que les résultats «
positifs », alors même s'ils sont les moins fiables ? Il est troublant que dans
une maladie aussi fréquente et grave que le diabète de type 2, il n'existe que
3 études cliniques randomisées contre placebo évaluant l'effet des thérapeutiques
sur des critères cliniquement pertinents [25] (UGDP [21] et ProActive [26])
; alors même que l'on trouve des milliers d'articles ayant comme sujet le diabète
de type 2. On peut se demander si la recherche est vraiment au service des malades...
Conflits d'intérêt : néant.
Références
- UGDP : a study of the effects of hypoglycemic agents on vascular complications
in patients with adult-onset diabetes : II. Mortality results. Diabetes. 1970;(S2):785-830.
- McCormack J, Greenhalgh T. Seeing what you want to see in randomised controlled
trials : versions and perversions of UKPDS data. BMJ. 2000;320:1720-3.
- Montori VM, Wang YG, Alonso-Coello P, Bhagra S. Systematic evaluation of
the quality of randomized controlled trials in diabetes. Diabetes Care. 2006;29:1833-8.
- Schulz KF, Chalmers I, Hayes RJ, Altman DG. Empirical evidence of bias.
Dimensions of methodological quality associated with estimates of treatment
effects in controlled trials. JAMA. 1995;273:408-12.
- Kunz R, Vist G, Oxman AD. Randomisation to protect against selection bias
in healthcare trials. Cochrane Database Syst Rev. 2007 Apr 18;(2):MR000012.
- Bajard A, Chabaud S, Pérol D, Boissel JP, Nony P, et al. Revisiting the
level of evidence in randomized controlled clinical trials : a simulation
approach. Contemp Clin Trials. 2009;30:400-10.
- Turner RC, Cull C, Holman R. UKPDS 17 : a 9 year update of a randomized,
controlled trial on the effect of improved metabolic control complications
in non-insulin-dependent diabetes mellitus. Ann Intern Med. 1996;124:136-45.
- UKPDS 13 : relative efficacy of randomy allocated diet, sulphonylurea, insulin,
or metformin in patients with newly diagnosed non-insulino dependent diabetes
followed for three years. BMJ. 1995;310:83-8.
- UK Prospective Diabetes Study (UKPDS) Group. Intensive blood-glucose control
with sulphonylureas or insulin compared with conventional treatment and risk
of complications in patients with type 2 diabetes (UKPDS 33). Lancet. 1998;352:837-53.
- UK Prospective Diabetes Study (UKPDS) Group. Effect of Intensive blood-glucose
control with metformin on complications in overweight patients with type 2
diabetes (UKPDS 34). Lancet. 1998;352:854-65.
- Turner RC, Mann JI, Iceton G, Oakes S, Smith A, Moore J, et al. UK Prospective
Study of therapies of maturity-onset diabetes. I Effect of diet, sulphonylurea,
Insulin or Biguanide therapy on fasting plasma glucose and body weight over
one year. Diabetologia. 1983;24:404-11.
- AFSSAPS/HAS. Traitement médicamenteux du diabète de type 2. Recommandation
de Bonne Pratique. Novembre 2006.
- Turner RC, Holman RR, Matthews DR, Oakes SF, Bassett RA, Stratton IM et
al. UKPDS 8. Study design, progress and performance. Diabetologia. 1991;34:877-90.
- Gerstein HC. Intensive blood glucose control reduced type 2 diabetes mellitus-related
end points. ACP J Club. 1999;132. Jan/Fev.
- Montori VM, Permanyer-Miralda G, Ferreira-González I, Busse JW, Pacheco-Huergo
V, Bryant D et al. Validity of composite end points in clinical trials. BMJ.
2005;330:594-6.
- Moher D, Schulz KF, Altman DG. The CONSORT statement : revised recommendations
for improving the quality of reports of parallel-group randomised trials.
Lancet. 2001;357:1191-4.
- The ADVANCE Collaborative Group. Intensive blood glucose control and vascular
outcomes in patients with type 2 diabetes. NEJM. 2008;358:24:2560-72.
- Margetts BM. United Kingdom prospective diabetes study. Compliance with
diet will affect results. BMJ. 1995;310: 1005-6.
- UK Prospective Diabetes Study Group. Tight blood pressure control and risk
of macrovascular and microvascular complications in type 2 diabetes : UKPDS
38. BMJ. 1998:317:703-13.
- Kooy A, et al. Long-term effects of metformin on metabolism and microvascular
and macrovascular disease in patients with type 2 diabetes mellitus. Arch
Intern Med. 2009;169:616-25.
- Selvin E. Cardiovascular outcomes in trials of oral diabetes mediations.
Arch Intern Med. 2008;168:2070-80.
- Stratton IM, Adler AI, Neil HA, Matthews DR, Manley SE, Cull CA, et al.
Association of glycaemia with macrovascular and microvascular complications
of type 2 diabetes (UKPDS 35) : prospective observational study. BMJ. 2000;321:405-12.
- Holman RR, Paul SK, Bethel MA, Matthews DR, Neil HA. 10year follow-up of
intensive glucose control in type 2 diabetes. NEJM. 2008;359:1577-89.
- Bernard C. Introduction à l'étude de la méthode expérimentale. Paris: Baillière;
1865.
- Montori VM, Gandhi GY, Guyatt GH. Patient-important outcomes in diabetes.
Time for consensus. Lancet. 2007;370:1104-6.
- Dormandy JA, Charbonnel B, Eckland DJ, Erdmann E, Massi-Benedetti M, Moules
IK, Skene AM, et al. PROactive investigators. Secondary prevention of macrovascular
events in patients with type 2 diabetes in the PROactive Study (PROspective
pioglitazone Clinical Trial In macroVascular Events) : a randomised controlled
trial. Lancet. 2005;366:1279-89.
Note :
Boissel JP. Lecture critique : les huit questions. Application à UKPDS 33.
Le « côté obscur » d'UKPDS
En guise de conclusion (tableau)
| Pour aider à concrétiser la distinction en analyse et lecture
critique, voici, suivant le modèle proposé dans Médecine, la lecture critique
d'UKPDS, en fin de l'analyse critique présentée dans les deux articles parus
en septembre et dans ce numéro. En lisant ces articles, on aura compris que
les comptes rendus d'UKPDS ne sont pas faciles d'accès. Pourtant, il est possible
pour un néophyte, en y consacrant un peu de temps, de sentir que cette affaire
n'est pas claire. Le guide proposé par Médecine doit lui permettre de parvenir
à cette conclusion sans trop de peine. Et même, en l'appliquant sans les états
d'âme auxquels une longue pratique des traitements testés dans cet essai nous
contraint, l'arrêt s'impose dès la seconde question...
Les deux articles de R. Boussageon, présentant l'analyse critique
des deux publications princeps d'UKPDS détaillent et expliquent les insuffisances
que la lecture critique nous a fait qu'identifier.
|