Interaction revisited: la différence entre deux estimations

Nous voulons souvent comparer deux estimations de la même quantité provenant d’analyses séparées. Ainsi, nous pourrions vouloir comparer l’effet du traitement dans les sous-groupes dans un essai randomisé, tels que deux groupes d’âge. Le terme pour une telle comparaison est un test d’interaction. Dans les Notes de Statistique antérieures, nous avons discuté de l’interaction en termes d’hétérogénéité de l’effet du traitement. 1 – 3 Ici, nous revisitons l’interaction et considérons le concept de manière plus générale.La comparaison de deux quantités estimées, comme les moyennes ou les proportions. est une méthode générale qui peut être largement appliquée. Les deux estimations devraient être indépendantes, non obtenues à partir des mêmes individus et les exemples sont les résultats de sous-groupes dans un essai randomisé ou de deux études indépendantes. Les échantillons devraient être grands. Si les estimations sont E1 et E2 avec les erreurs types SE (E1) et SE (E2), alors la différence d = E1 − E2 a l’erreur type SE (d) = √ &#x0005b SE (E1) 2 + SE (E2) 2 ] (c’est-à-dire la racine carrée de la somme des carrés des erreurs types séparées).Cette formule est un exemple d’une relation bien connue selon laquelle la variance de la différence entre deux estimations est la somme des variances séparées (ici la variance est le carré de l’erreur-type). Alors le rapport z = d / SE (d) donne un test de l’hypothèse nulle que dans la population la différence d est nulle, en comparant la valeur de z à la distribution normale standard. Le 95 % L’intervalle de confiance pour la différence est d − 1.96SE (d) à d + 1.96SE (d). Nous avons illustré ceci pour les moyennes et les proportions3, bien que nous n’ayons pas montré comment obtenir l’erreur-type de la différence. Nous considérons ici la comparaison des risques relatifs ou des rapports de cotes. Ces mesures sont toujours analysées sur l’échelle logarithmique car les distributions des log ratios tendent à être plus proches de la normale que des ratios eux-mêmes. Dans une méta-analyse des fractures non vertébrales dans les essais randomisés de l’hormonothérapie substitutive, le risque relatif estimé de 22 essais, il y avait 0,73 (P = 0,02) en faveur de l’hormonothérapie substitutive.4 De 14 essais menés sur des femmes âgées en moyenne de 60 ans, le risque relatif était de 0,67 (intervalle de confiance de 0,46 à 0,98; P = 0,03). Dans huit essais sur des femmes âgées de 60 ans, le risque relatif était de 0,88 (0,71 à 1,08; P <0,03); En d'autres termes, chez les femmes plus jeunes, l'avantage du traitement estimé était de 33 % la réduction du risque de fracture, qui était statistiquement significative, par rapport à un 12 % réduction chez les femmes âgées, ce qui n'était pas significatif. Mais les risques relatifs des sous-groupes sont-ils significativement différents les uns des autres? Nous montrons comment répondre à cette question en utilisant seulement les données sommaires citées. Parce que les calculs ont été faits sur l'échelle logarithmique, la comparaison des deux estimations est complexe (voir tableau). Nous devons obtenir les journaux des risques relatifs et leurs intervalles de confiance (rangées 2 et 4) .5 Comme 95 % les intervalles de confiance sont obtenus en tant qu'erreurs-type de 1,96 de chaque côté de l'estimation, le SE de chaque risque relatif de log est obtenu en divisant la largeur de son intervalle de confiance par 2 × 1,96 (ligne 6). La différence estimée des risques relatifs de log est d = E1 − E2 = − 0.2726 et son erreur type 0.2206 (ligne 8). A partir de ces deux valeurs, nous pouvons tester l'interaction et estimer le rapport des risques relatifs (avec un intervalle de confiance). Le test d'interaction est le rapport de d à son erreur standard: z = − 0.2726 / 0.2206 = − 1.24, ce qui donne P = 0.2 lorsque nous le référons à une table de la distribution normale. L'effet d'interaction estimé est exp (− 0.2726) = 0.76. (Cette valeur peut aussi être obtenue directement comme 0.67 / 0.88 = 0.76.) L'intervalle de confiance pour cet effet est − 0.7050 à 0.1598 sur l'échelle logarithmique (ligne 9). En revenant à l'échelle de risque relative, nous obtenons 0,49 à 1,17 (ligne 12) corticothérapie. Il n’y a donc aucune bonne preuve pour soutenir un effet de traitement différent chez les femmes plus jeunes et plus âgées. La même approche est utilisée pour comparer les rapports de cotes. La comparaison des moyennes ou des coefficients de régression est plus simple car il n’y a pas de transformation de journal. Les deux estimations doivent être indépendantes: la méthode ne doit pas être utilisée pour comparer un sous-groupe avec l’ensemble du groupe, ni deux estimations pour les mêmes patients. Le pouvoir de détecter les interactions est limité, même dans une méta-analyse combinant les résultats de plusieurs études . Comme l’illustre cet exemple, même lorsque les deux estimations et les valeurs de P semblent très différentes, le test d’interaction peut ne pas être significatif. Il ne suffit pas que le risque relatif soit significatif dans un sous-groupe et pas dans un autre. Inversement, il n’est pas correct de supposer que lorsque deux intervalles de confiance se chevauchent, les deux estimations ne sont pas significativement différentes6. L’analyse statistique devrait être ciblée sur la question en question et non basée sur la comparaison des valeurs P d’analyses séparées2 |