Statistiques et médecine sont comme deux soeurs ennemies qu'il est impossible de séparer. Plusieurs raisons sont en jeu. Les traitements se basent sur des essais qui produisent des statistiques qui elles mêmes conditionnent le développement des traitements et et leur commercialisation.
Or les statistiques ont assez mauvais caractère.
D'une part il faut que le nombre de données soit suffisant.
Evident direz-vous, il suffit de répéter les mesures. Pas toujours si facile que cela. C'est par exemple la cas des maladies rares où les échantillons ne sont pas suffisants pour pouvoir utiliser l'arsenal des statistiques sans risque important d'erreur. Il y a aussi les maladies tropicales où les personnes souffrantes ne sont pas facilement accessibles. Et puis il y a ces probabilités conditionnelles qui font que la probabilité qu'un traitement fonctionne sachant que la personne est malade, n'est pas du tout identique à la probabilité que quelqu'un ne soit pas malade sachant qu'il a été traité, et qui est parfois bien inférieure. Ce peut aussi être le cas pour évaluer l'efficacité de certains traitements sur des personnes d'âge, de sexe, de poids et d'état de santé très différents. Tester l'efficacité d'un médicament sur un homme de 25 ans et mince ne veut pas dire qu'elle sera la même sur une femme obèse de 60 ans ayant déjà été traitée d'un cancer. Il faut là encore suffisamment de données pour avancer un résultat avec un risque d'erreur acceptable.
Les conditions dans lesquelles doivent se faire l'expérience peuvent aussi augmenter le nombre de mesures. Il faut introduire des placebos. Elles doivent être rigoureuses, en double aveugle, faire des mesures de façon aléatoire, etc...
D'autre part, il faut interpréter les chiffres obtenus. Le travail du statisticien, tient tout autant à l'adaption de ses outils au problème traité qu'à leur interprétation. Or c'est bien souvent la société qui commande et donc paye ces tests qui les utilise. Il y a donc un conflit. A partir de quel moment est-il acceptable de remplacer un produit A par un produit B sachant que son développement a souvent couté beaucoup d'argent ?
Il est parfois très difficile de montrer qu'un produit est supérieur à un autre. Les effets secondaires peuvent être différents, tout comme le taux de mortalité. Quels critères prendre en compte et quel poids leur donner ?
Indépendamment de tout cela, les statistiques ont elles-mêmes leur propres limites. Il est absolument impossible de passer de la mesure sur un échantillon à un chiffre sur la population toute entière sans donner le risque d'erreur que l'on commet. Ce risque d'erreur est bien souvent irréductible, quelques % ou quelques dixièmes de %. Considérons donc que l'on élabore un nouveau médicament dont les tests statistiques indiquent une efficacité moindre qu'un autre médicament déjà commercialisé mais dont ce % est inférieur à la marge d'erreur incompressible. Il devient e ce fait non-significatif. Il peut donc être accepté comme médicament équivalent même si l'on a mis en évidence une efficacité qui semble moindre.
Un pas de plus peut être franchi avec la notion de non-infériorité.
Ci-après un extrait du blog d'un cardiologue:
Pourtant, encore une fois, toutes les décisions médicales actuelles et futures se basent et se baseront sur des études cliniques, elles même basées sur des concepts statistiques plus ou moins sophistiqués.
Au début, un peu comme tout le monde, j’ai fait confiance aux revues scientifiques, et aux quelques bases mathématiques enseignées en médecine pour trier le bon grain de l’ivraie.
Mais je me suis rapidement rendu compte, que c’était une erreur, et qu’il fallait développer un peu mes connaissances statistiques pour développer mon sens critique, et résister aux Chants des Sirènes.
Depuis peu donc, éclosent des études dites « d’équivalence » ou de « non infériorité ».
Pourquoi un tel développement ?
Primo, car il est plus simple de démontrer qu’un produit est non inférieur, que de prouver qu’il est supérieur en terme de statistiques. Secundo car la taille des échantillons étudiés peut être moindre, donc des coûts plus faibles. Tertio, le risque marketing est moindre, une étude « de non infériorité » positive vaut mieux qu’une étude de supériorité négative (qui signifie l’enterrement quasi systématique du produit).
L’étude pourra donc être positive, donc favorable pour A, même si A est jugé équivalent à B.
L'intégralité des notes : La non-infériorité et Let’s talk about stats (2).
Bonne lecture.