John Libbey Eurotext

Bulletin du Cancer

MENU

Le score de propension : intérêt et limites Volume 94, numéro 7, Juillet-Août 2007

Auteurs
Unité de recherche clinique, Centre Jean Perrin, 58 rue Montalembert, 63011 Clermont-Ferrand, CHGE, Hôtel-Dieu, boulevard Léon-Malfreyt, 63058 Clermont-Ferrand, Service de radiothérapie, Centre Jean Perrin, 63011 Clermont-Ferrand, Unité de recherche clinique, Centre Antoine Lacassagne, Nice, Unité de biostatistiques, CRLC Val d’Aurelle – Paul Lamarque, 34298 Montpellier

Le score de propension (propensity score), indicateur de la propension à utiliser une modalité thérapeutique parmi deux (parfois plus), se rencontre dans les études non randomisées (prospectives ou rétrospectives). Son calcul s’effectue après recherche des facteurs prédictifs du choix thérapeutique et correspond à la probabilité de recevoir un des traitements conditionnellement aux variables observées avant traitement. Cette probabilité est généralement issue d’une équation de régression logistique. Résumant à lui seul tout un ensemble de paramètres, il peut alors être utilisé comme cofacteur dans d’autres modèles multivariés, cherchant à évaluer avec un risque de confusion réduit l’impact des modalités thérapeutiques sur des critères comme la survie, la morbidité, les effets secondaires ou encore la qualité de vie… Il semble très pratique pour effectuer des appariements ou des stratifications afin de comparer ces critères au sein des sous-groupes obtenus. En dépit de cet artifice qui permet d’obtenir des sous-groupes a posteriori semblables, cette méthode ne peut prétendre atteindre le niveau de preuve des essais randomisés car l’absence de biais ne peut être garanti. Hormis cette faiblesse méthodologique majeure, le score de propension paraît de moindre utilité dans les études disposant d’un large effectif puisque, dans ces cas, les modèles multivariés peuvent inclure suffisamment de covariables pour produire de manière valide des conclusions stables. Quand les effectifs sont réduits, il conserve un intérêt, bien que sa fiabilité dépende, là encore, de la taille des échantillons et que les conclusions soient toujours à nuancer. Des exemples sont donnés pour illustrer notre propos.