ARTICLE
Auteur(s) : C
Lejeune1, C
Binquet1, F
Bonnetain1,2
1Inserm U866, université de Bourgogne, 7,
boulevard Jeanne-d’Arc, BP 87900, 21079 Dijon cedex, France
2Fédération francophone de cancérologie digestive,
7, boulevard Jeanne-d’Arc, BP 87900, 21079 Dijon cedex, France
Article reçu le 13 Février 2009, accepté le 24 Février 2009
Pertinence des évaluations économiques dans les essais
thérapeutiques en cancérologie
L’existence des fortes contraintes budgétaires pesant sur le
système de santé amène les décideurs à se poser la question de la
cohérence des arbitrages à réaliser en matière d’allocation des
ressources collectives au regard du bénéfice attendu pour le
patient et le système de santé. Cette problématique de l’allocation
optimale des ressources explique l’intérêt grandissant porté à
l’évaluation médico-économique. L’évaluation médico-économique peut
être définie comme un processus d’analyse comparative de stratégies
thérapeutiques, sur la base de leurs coûts comme de leurs résultats
de santé. Le recueil de données économiques est, de plus en
plus, souvent réalisé dans le cadre des essais de supériorité.
L’élément de coût s’avérera d’autant plus utile que la différence
d’efficacité observée entre les stratégies comparées est considérée
comme cliniquement faible. Le différentiel de coût peut alors
aider à la décision sur un plan collectif quant à l’utilisation
d’un nouveau traitement ou d’une stratégie thérapeutique.
En cancérologie, les coûts des traitements et prises en charge
augmentent de manière exponentielle depuis près de dix ans. Cette
situation justifie, intrinsèquement, la place des évaluations
médico-économiques dans les essais cliniques, et notamment dans les
essais qui sont menés pour optimiser les stratégies de prise en
charge sans en altérer l’efficacité. Tel est le cas des essais où
des pauses thérapeutiques sont instituées [1], et des essais où la
fréquence d’administration des chimiothérapies est diminuée.
Ces schémas thérapeutiques nécessitent de démontrer au
préalable la non-infériorité de l’efficacité de tels schémas.
Les objectifs finaux de ces essais sont, ultimement, de
prouver une amélioration de la qualité de vie des patients, une
limitation des toxicités associées aux stratégies comparées et/ou
une diminution des coûts de prise en charge des patients [2].
Compte tenu de ces objectifs intrinsèques, les essais d’équivalence
ou de non infériorité se prêtent souvent au recueil de données
économiques. En effet, après avoir démontré l’équivalence ou la
non-infériorité des traitements, le coût, utilisé comme critère de
jugement secondaire, devient un des objectifs décisionnels au même
titre que la qualité de vie ou les toxicités associées aux
traitements évalués. Cependant, la réalisation d’essais de non
infériorité ou d’équivalence requiert d’inclure un nombre important
de patients, réduisant ainsi leur faisabilité nonobstant leur
pertinence [2]. Certains auteurs ont proposé des méthodes pour
rendre ces essais faisables, notamment, en envisageant un schéma
mixte, non infériorité et supériorité, dans le cas où un gain
faible d’efficacité est espéré avec le nouveau schéma [2]. Une
autre alternative pourrait être de réaliser d’emblée des essais de
supériorité dont l’objectif principal serait un critère composite
médico-économique.
Essais médico-économiques
Spécificité du critère de jugement des essais
médico-économiques
Certains auteurs considèrent que l’étude des coûts et de
l’efficacité des traitements comparés pourrait être un objectif
pertinent et utile pour les essais thérapeutiques [3-5]. Dans ce
cadre, ils ont proposé de mener des essais dont l’objectif
principal est médico-économique. Le critère de jugement
principal n’est alors plus seulement la survie globale, la survie
sans maladie ou la survie sans progression. Il devient un
critère composite, basé à la fois sur le coût et l’efficacité des
stratégies comparées.
La réalisation d’évaluations médico-économiques conduit à quatre
types de résultats représentés par les quatre quadrants de la figure 1 :
- – soit l’innovation est moins coûteuse et au moins aussi
efficace que la stratégie de référence : on dit qu’elle est «
dominante », et elle peut ainsi être recommandée. Il s’agit
des objectifs espérés dans le cadre d’un essai de non infériorité
ou de supériorité ;
- – soit l’innovation est plus coûteuse et moins efficace
que la stratégie de référence : elle est dite « dominée », et elle
ne peut être considérée comme coût-efficace ;
- – soit l’innovation est moins coûteuse et moins efficace
que la référence, ce qui pose la question de savoir si les
économies dégagées sont suffisantes pour compenser une baisse de
l’efficacité ;
- – soit l’innovation est plus coûteuse et plus efficace
que la stratégie de référence.
Cette situation nécessite alors de déterminer si l’augmentation
du coût est acceptable en regard du gain d’efficacité obtenu. Cet
arbitrage s’effectue au travers du calcul d’un ratio
coût/efficacité différentiel, noté ΔC/ΔE, définit comme le rapport
entre la différence du coût moyen de deux traitements comparés sur
la différence d’efficacité moyenne de ces mêmes traitements.
Il s’interprète comme le surcoût engendré par le traitement
novateur pour gagner une unité d’efficacité supplémentaire par
rapport au traitement de référence. Une fois le ratio
coût-efficacité différentiel ΔC/ΔE calculé, il s’agit de statuer
sur son caractère acceptable ou non. Cet arbitrage pose alors la
question de la détermination du ratio seuil, c’est-à-dire du
montant monétaire jusqu’au niveau duquel la collectivité est prête
à aller pour obtenir ce gain supplémentaire d’efficacité.
La décision d’introduire un nouveau traitement et/ou d’un
nouveau schéma d’administration dépend donc de ce seuil.
Dans la situation d’un essai de non infériorité, l’objectif de
l’essai serait, par exemple, de démontrer que le traitement a une
efficacité non inférieure à la stratégie de référence mais avec
l’espérance qu’elle est moins coûteuse. De fait, l’hypothèse
pour conduire un essai de supériorité dont l’objectif principal est
médico-économique serait de stipuler que le rapport ΔC/ΔE associé à
la nouvelle stratégie lui est favorable.
Méthodes d’estimation du nombre de sujets
nécessaire
Comme dans tout essai clinique, la planification d’études dont
l’objectif principal serait médico-économique nécessite de calculer
le nombre de sujets nécessaire afin de tester les hypothèses
stipulées pour cet objectif principal.
Plusieurs approches destinées à estimer le nombre de sujets
nécessaires à la conduite d’un essai de supériorité
médico-économique ont été proposées dans la littérature, parmi
lesquelles :
- – l’approche reposant sur l’estimation de l’intervalle
de confiance du ratio coût-efficacité différentiel [3, 4] ;
- – l’approche reposant sur le concept de coût
d’opportunité [5].
Le coût d’opportunité correspond à la valeur d’une stratégie B à
laquelle il faudrait renoncer pour mettre en place une stratégie A.
Cette note technique ne concernera que la première approche, car
c’est sans doute celle qui a été le plus développée. Dans cette
approche, l’objectif est de démontrer que le nouveau traitement est
coût-efficace, c’est-à-dire que le ratio coût-efficacité
différentiel, ΔC/ΔE tel qu’il a été présenté précédemment, peut
être considéré comme acceptable. En d’autres termes, il s’agit de
déterminer si ΔC/ΔE est inférieur à un ratio seuil d’acceptabilité,
R préalablement fixé. Dans ce but, H0 (ΔC/ΔE = R) et H1 (ΔC/ΔE <
R) sont testées au travers d’un processus itératif reposant sur un
certain nombre d’hypothèses définies a priori. Ces hypothèses
portent sur le coût et l’efficacité des stratégies comparées, mais
également sur le seuil d’acceptabilité R et sur une hypothèse faite
du nombre de sujets nécessaires dans chacun des bras de traitement.
À partir de ces hypothèses, l’intervalle de confiance à 95 % du
ratio coût/efficacité différentiel est estimé. Puis, la règle de
décision suivante est appliquée : si l’intervalle de confiance se
situe en dessous du seuil R fixé a priori, on peut rejeter H0 au
risque de 5 % et considérer que ce nombre de sujets prévu
initialement suffit. Au contraire, si R est contenu dans
l’intervalle de confiance, l’effectif est insuffisant pour
conclure. Il est alors nécessaire d’estimer un nouvel
intervalle de confiance en partant d’un nombre de sujets nécessaire
plus important.
Méthodes d’estimation de l’intervalle
de confiance
Une des difficultés associée à cette approche du calcul du nombre
de sujets nécessaire réside dans le choix de la technique à
utiliser pour estimer l’intervalle de confiance du ratio
coût-efficacité différentiel. On distingue plusieurs approches
parmi lesquelles :
- – la méthode de la « boîte » ;
- – la méthode de Fieller ;
- – la technique du bootstrap non paramétrique [3,
4].
La méthode de la « boîte » consiste à combiner la variance
autour du différentiel de coût moyen et la variance autour du
différentiel d’efficacité moyenne. Cette méthode requiert de
nombreuses hypothèses, tant sur les données de coût que
d’efficacité (coûts moyens et efficacités moyennes, variance des
coûts moyens et des efficacités moyennes dans chaque bras de
traitement) et présente la limite majeure de générer des
intervalles de confiance souvent étendus. Par ailleurs, cette
méthode fait l’hypothèse implicite d’une corrélation négative entre
les différentiels de coût et d’efficacité. La méthode de
Fieller est une méthode paramétrique, d’estimation de l’intervalle
de confiance, basée sur l’hypothèse, difficile à démontrer, que les
coûts et efficacité suivent une distribution normale bivariée. Par
ailleurs, elle requiert également de nombreuses hypothèses sur les
données de coût et d’efficacité. Une dernière méthode est
l’approche par simulation reposant sur la technique du bootstrap
non paramétrique. Le principe de cette méthode consiste, à
partir d’un échantillon de patients dont les données individuelles
d’observation de coût et d’efficacité pour les deux bras de
traitement sont disponibles et recueillies lors d’une étude pilote,
à réaliser n tirages au sort aléatoires avec remise d’un nombre de
sujets donné pour constituer n nouveaux échantillons.
Le calcul des ratios coût/efficacité différentiels associé à
chacun des n tirages, puis leur comparaison au seuil
d’acceptabilité R permet d’estimer la puissance associée à l’essai
médico-économique à venir. Si la puissance souhaitée n’est pas
atteinte (classiquement 80 %), un nouveau bootstrap est réalisé en
augmentant le nombre de sujets à inclure. L’intérêt de cette
technique est de ne pas présupposer la normalité de la distribution
du coût et de l’efficacité des stratégies comparées. En revanche,
elle nécessite de disposer de données d’observation individuelles.
Cette technique du bootstrap pourrait être considérée comme une
invitation à envisager la mise en place d’une évaluation
médico-économique dans le cadre d’un essai de phase II pilote,
permettant ensuite de poser les hypothèses utiles à la réalisation
d’un essai de supériorité médico-économique pour un essai de phase
III.
Le tableau 1 synthétise les avantages
et les limites de ces trois méthodes. Quel que soit le type de
méthode utilisé, l’approche par l’intervalle de confiance du ratio
coût/efficacité différentiel nécessite préalablement plus
d’informations qu’un essai clinique pour le calcul du nombre de
sujets nécessaires. La méthode du bootstrap semble devoir être
privilégiée, car elle permet de s’affranchir de l’hypothèse de la
normalité des coûts et de l’efficacité. Mais elle requiert de
disposer de données d’observations de coût et d’efficacité que
seule une étude pilote est susceptible de fournir.
Tableau 1 Avantages et limites des méthodes
d’estimation de l’intervalle de confiance du ratio coût/efficacité
différentiel.
|
Avantages
|
Limites
|
|
Méthode de la « boîte »
|
Pas de données individuelles d’observation de coût et d’efficacité
dans chacun des bras de traitement
|
- Hypothèses préalables nécessaires sur le coût et l’efficacité
des stratégies comparées
- Détermination d’un ratio seuil d’acceptabilité
- Hypothèse d’une corrélation négative entre coût et effet
- Intervalles de confiance larges
|
|
Méthode de Fieller
|
Pas de données individuelles d’observation de coût et d’efficacité
dans chacun des bras de traitement
|
- Hypothèses préalables nécessaires sur le coût et l’efficacité
des stratégies comparées
- Détermination d’un ratio seuil d’acceptabilité
- Hypothèse d’une distribution normale bivariée du coût et de
l’efficacité
|
|
Méthode du bootstrap non paramétrique
|
Pas d’hypothèse concernant la normalité des coûts et des effets
|
- Détermination d’un ratio seuil d’acceptabilité
- Données individuelles d’observations de coût et d’efficacité
dans chacun des bras nécessaires
|
Limites de ces méthodes
L’une des incertitudes majeures, commune à l’ensemble de ces trois
techniques, concerne la détermination du seuil d’acceptabilité R
qui conditionne le calcul du nombre de sujets nécessaire. Un
certain nombre de seuils ont été suggérés dans la littérature, mais
ils ne s’appliquent qu’aux essais intégrant, dans leur critère de
jugement principal, la survie. Par ailleurs, ces seuils varient
fortement selon les pays : environ 12 000 € par année de vie
gagnée ajustée sur la qualité de vie pour le Canada, 37 000 €
par année de vie gagnée ajustée sur la qualité de vie pour
l’Angleterre [6] et 50 000 € par année de vie gagnée pour la
France [7, 8]. Le choix de ces seuils est généralement peu
argumenté, ce qui rend difficile les transpositions d’un pays à un
autre compte tenu de modes d’organisation des systèmes de santé peu
comparables ou de choix de société différents en termes de
financement.
Les modalités du calcul du nombre de patients propre à ce ratio
induisent par ailleurs une réflexion éthique préalable. Améliorer
la précision du ratio coût/efficacité, alors qu’on a la précision
souhaitée sur le critère d’efficacité clinique, nécessite
d’augmenter le nombre de patients requis pour la puissance de
l’essai. Cette problématique sera moindre si l’essai de supériorité
médico-économique se substitue à un essai de non infériorité
nécessitant de nombreux patients. De plus, la conduite d’un
tel essai sera, potentiellement, contrebalancée par les économies
que l’on pourrait réaliser pour le système de santé.
Enfin, la question du choix du seuil d’acceptabilité devient
encore plus délicate lorsque le critère d’efficacité n’intègre pas
la survie. La détermination d’un seuil de décision publique
pourrait, cependant, être affinée avec l’utilisation des méthodes
de révélation des préférences qui sont utilisées dans le champ de
l’économie de la santé. Parmi ces méthodes, l’approche de la «
disposition-à-payer » suscite un intérêt particulier [6]. Elle
permet d’estimer ce qu’un individu serait prêt à payer, au maximum,
pour avoir accès à un programme susceptible de modifier son état de
santé. Même si le passage de la révélation de préférences
individuelles à la révélation de préférences collectives, sur
laquelle pourrait s’appuyer les décisions des autorités de santé
publique, continue de poser des problèmes méthodologiques
importants, cette approche pourrait représenter une voie
prometteuse de recherche, en vue de créer un outil d’aide à la
décision publique.
Conclusion
Cette typologie d’essais pourrait avoir une place privilégiée dans
la problématique des études dont l’objectif principal repose sur la
non-infériorité. La faisabilité des essais de non infériorité
en cancérologie rend l’approche d’essais de supériorité
médico-économique prometteuse et pertinente. En revanche, conduire
ce type d’essais nécessite de réaliser des essais de phase II avec
un recueil des données économiques pour estimer les coûts.
Des études de simulations prospectives visant à comparer la
durée et le nombre requis de patients pour la conduite d’un essai
de non infériorité, et un essai de supériorité médico-économique
doivent être menées au préalable afin de valider ce concept.
Références
1 Tournigand C, Cervantes A, Figer A, Lledo G,
Flesch M, Buyse M, et al. OPTIMOX1: a randomized
study of FOLFOX4 or FOLFOX7 with oxaliplatin in a stop-and-go
fashion in advanced colorectal cancer: a GERCOR study. J Clin Oncol
2006 ; 24 : 394-400.
2 Freidlin B, Korn EL, George SL, Gray R.
Randomized clinical trial design for assessing non-inferiority when
superiority is expected. J Clin Oncol 2007 ; 25 :
5019-23.
3 Al MJ, van Hout BA, Michel BC, Rutten FF.
Sample size calculation in economic evaluations. Health Econ
1998 ; 7 : 327-35.
4 Briggs AH, Gray AM. Power and sample size
calculations for stochastic cost-effectiveness analysis. Med Decis
Making 1998 ; 18 : S81-S92.
5 Gafni A, Walter SD, Birch S, Sendi P. An
opportunity cost approach to sample size calculation in
cost-effectiveness analysis. Health Econ 2008 ; 17 :
99-107.
6 Drummond MF, O’Brien BJ, Stoddart GL,
Torrance GW. Méthodes d’évaluation économique des programmes
de santé. Paris, 1997.
7 Black WC. The CE plane: a graphic representation of
cost-effectiveness. Med Decis Making 1990 ; 10 :
212-4.
8 Moatti JP, Le Corroller Soriano AG, Protière C.
Le Plan Cancer en France : une réflexion d’économistes. Bull Cancer
2003 ; 90 : 1010-5.
|