Enseignement de post graduation d’épidémiologie 1ère année
Le test du khi deux (X2)
Risques d’erreur statistique et test statistique
Origine de la problĂŠmatique
Fluctuations aléatoires Échantillon 1 48%
Obtenir pile à pile ou face (Probabilité = 50%)
Échantillon 2 52%
Échantillon 3 50%
Échantillon 4 45%
Fluctuations aléatoires Échantillon 1 9%
Même type de patients (Probabilité d'AVC = 12%)
Échantillon 2 12%
Échantillon 3 16%
Échantillon 4 26%
Fluctuations aléatoires d'échantillonnage • Fortes pour des effectifs petits et moyens • Faibles pour des grands effectifs • Jamais nulles
• Conséquences pour la comparaison de 2 échantillons – les proportions observées dans 2 échantillons peuvent être différentes – uniquement du fait du hasard – même si dans ces 2 échantillons la vraie probabilité était la même
Conséquences des fluctuations Effet du traitement = 0 Vrai risque = 10%
Vrai risque = 10%
Groupe T+
Groupe T-
Risque observé = 6%
Risque observé = 12%
Différence observée = -6%
Problématique des comparaisons • Quand on ignore la réalité, la différence observée de -6% est-elle ? – une manifestation des fluctuations aléatoires, donc due uniquement au hasard – la traduction d’une réelle différence entre les deux groupes, donc d’un effet non nul du traitement
• Comment départager ces 2 possibilités ? •
Solution : test statistique
.
But des comparaisons • Quel est le but des comparaisons ? Grp T
diff -6%
Conclure à l'existence d'une différence
Décider d'utiliser le nouveau traitement
Grp C
La conclusion doit être conforme à la réalité mais elle se base uniquement sur l’observé
Effets des fluctuations dans une comparaison • Le hasard peut faire apparaître une différence qui n'existe pas en réalité • Inversement, le hasard peut réduire une différence qui existe réellement • donc 2 façons de fausser la conclusion
Risques d’erreur statistique
Risques de conclusions erronées • Deux risques d'erreur – Risque alpha – Risque bêta
• Erreurs statistiques – dues uniquement au hasard
Erreur statistique alpha • Conclure à l'existence d'une différence qui n'existe pas en réalité : faux positif Échantillon 1 7.5%
Différence non réelle
Vrai valeur 12% Échantillon 2 15%
Erreur statistique bêta • Ne pas conclure à une différence qui existe pourtant en réalité : faux négatif Vrai valeur 12%
Échantillon 1 15%
Fausse absence de différence Vrai valeur 19%
Échantillon 2 15%
Risques d'erreur statistiques • Risque alpha : risque de conclure à une différence qui n’existe pas • Risque bêta : risque de ne pas mettre en évidence une différence qui existe réellement • Puissance : 1 - bêta : probabilité de mettre en évidence une différence qui existe réellement
Application à l’essai thérapeutique • Risque alpha : considérer comme efficace un traitement qui ne l’est pas • Risque bêta : ne pas conclure alors que le traitement est efficace • Puissance : montrer l’efficacité d’un traitement réellement efficace
Conclusion
Réalité
Différence Différence Pas de différence
Pas de différence Erreur bêta
Erreur alpha
Signification statistique Différence significative p<0.05 Il est peu probable que la différence observée soit due au hasard Différence observée
Test Différence non significative p>0.05 La probabilité que la différence observée soit due au hasard est forte
Seuil de signification statistique
Le test statistique • Donne une règle permettant de décider si l’on peut rejeter une hypothèse, en fonction des observations relevées sur des échantillons.
Poser une hypothèse
Hypothèse nulle : notée H0 définie comme une absence de différence Hypothèse alternative : hypothèse concurrente, notée H1
Analyser la compatibilité de cette hypothèse avec les observations issues de l’expérience.
Le test du khi2 ( X² )
• Il s’agit d’une mesure d’association statistique. • Le X2 teste la liaison entre deux variables qualitatives. • Il s’applique à tous les tableaux de contingence quel que soit le nombre de modalités des deux variables qualitatives. • Le calcul du X2 ne considère que les effectifs, jamais les fréquences relatives.
• Selon la situation, on distingue: Le test de X2 de conformité ou d’ajustement qui sert à compare une distribution observée sur un échantillon à une distribution connue dans une population ou à une distribution théorique. Le test de X2 d’homogénéité qui sert à comparer deux ou plusieurs distributions observées sur des échantillons.
Les différences constatées entre la distribution théorique et la distribution expérimentale restent-elles dans les limites des fluctuations de l’échantillonnage ou ces différences sont trop importantes pour être mises sur le compte du hasard?
Test du X² 1/ Le risque α= 5% 2/ Validité du test
tous les Ti ≥ 5, STi= SOi
tous les Ti ≥5, STi= SOi
Conformité entre distribution observée et distribution théorique
Calcul de l’effectif théorique= %théorique* SOi
Homogénéité entre deux ou plusieurs distributions observées
X2= S (Ti-Oi) 2 Ti
Calcul de l’effectif théorique= SOi (verticale)* SOi (horizontale) n X2= S (Ti-Oi) 2 Ti
d.d.l= K-1
d.d.l.= (L-1)(C-1)
4/ Calcul du X2
X² d’homogénéité ou d’indépendance
X² de conformité ou d’ajustement
3/ Hypothèse nulle: H0
5/ Degré de liberté: d.d.l. 6/ Détermination du X2 tabulaire ou critique X2c (α, d.d.l) K: nombre de classes
7/ Conclusion:
L: nombre de lignes, C: nombre de colonnes
Si H0
X² c ≥ X² t est rejetée
Si X² c < X² t H0 est retenue
------ Différence significative
au risque α
------ Différence non significative au risque α
Lorsque le test est significatif, il est d’usage de quantifier le degré de signification du test (p) Le degré de signification est la plus petite taille du test qui aurait permis avec ces données de rejeter le test (il s’agit d’une probabilité a posteriori).
Test de conformitĂŠ
Définition: Le test du X² de conformité consiste à comparer: 2 distributions: une observée à une autre théorique dans le cas du caractère qualitatif. Hypothèses: – Hypothèse nulle : • Les écarts constatés entre les effectifs observés et théoriques sont le fait du hasard. • La distribution observée suit la loi de probabilité théorique. • Il n’y a pas de différence. • Différence non significative. – Hypothèse alternative • La distribution observée ne suit pas la loi de probabilité théorique considérée. • Il existe une différence significative.
Calcul statistique – Tableau de contingence
Classe
A
B
C
D
Effectif
O1
O2
O3
O4
T1
T2
T3
T4
Observé Effectif Théorique
• Degré de liberté : – Nombre de classes – 1 soit d.d.l=K-1 • Conditions d’application: – Tous les effectifs théoriques doivent être supérieurs à 5. – Si les conditions ne sont pas remplies, il faut, quand cela est possible, regrouper logiquement des classes ou prendre d’autres méthodes. • Calcul du Khi 2:
K (0i-Ti)2
Khi2 = S i=1
Ti
Calcul de l’effectif théorique = % théorique ×SOi
•
Sur un échantillon de 284 sujets, on a observé la structure par âge ci-dessous (Oi). On veut vérifier si cet échantillon diffère de la structure par âge de la population générale (%pop). Age
Effectifs observés (Oi)
Proportions %pop
0-19 20-39 40-59 60-74 >74 Total
73 82 75 36 18 284
24,6 28,1 26,0 13,6 7,7 100
Effectifs théorique (Ti) 284 × % pop 69,9 79,8 73,8 38,6 21,9 284
Calcul de l’effectif théorique = % théorique ×SOi
Solution: 1234-
Calcul de l’effectif théorique= % théorique* SOi Le risque α= 5% Conditions d’application: tous les Ti ≥ 5 H0: la distribution par âge de l’échantillon est identique à celle de la population Calcul de la variable testée (X2):
Calcul du X2= (73-69,9)2 + (82-79,8)2 + (75-73,8)2 + (36-38,6)2+ (18-21,9)2 = 1,09 69,9 79,8 73,8 38,6 21,9 5- Degré de liberté: (d.d.l)= K-1= 5-1= 4 (K= nombre de colonnes dans le tableau) 6- X2 critique= f (α, d.d.l) : voir tableau 7- Conclusion: X2 < X2 critique (1,09 < 9,49) La différence est non significative au risque 5% On ne rejette donc pas H0 . Bien qu’on puisse jamais affirmer qu’une hypothèse nulle est vraie, on peut cependant considérer l’échantillon est représentatif de la population .
Test d’ homogénéité
Définition: • le test du X² d’homogénéité (ou d’indépendance) consiste à comparer 2 ou plusieurs distributions observées suivant plusieurs caractères qualitatifs. Hypothèses: – Hypothèse nulle : • Les écarts constatés entre les distributions sont le fait du hasard. • Il n’y a pas de différence. • Différence non significative. – Hypothèse alternative • Il existe une différence significative.
Calcul statistique
A
B
C
D
Distribution1
O1 T1
O2 T2
O3 T3
O4 T4
Distribution2
O5 T5
O6 T6
O7 T7
O8 T8
Distribution i
O.. T..
O.. T..
O.. T..
O.. T..
– Tableau de contingence
• Degré de liberté : – degré de liberté: DDL =γ=(L-1)(C-1) avec L= nombre de lignes et C= nombre de colonnes. • Conditions d’application: – Tous les effectifs théoriques doivent être supérieurs à 5, ∑Oi =∑Ti =n . • Calcul du Khi 2: K (0i-Ti)2 Khi2 = S i=1
Ti
Calcul de l’effectif théorique =
Le X2 d’homogénéité: exemple Le test de dépistage pour le virus du VIH est proposé systématiquement lors d’une grossesse. On désire savoir si la fréquence d’acceptation du test varie selon la religion de la femme enceinte .
Religion
A
B
C
D
Total
Test effectué
477
1746
248
135
2606
Test non fait
135
582
218
67
1002
Total
612
2328
466
202
3608
% tst eff
77,9
75
53,2
66,8
Solution: 1234-
Le risque α= 5% Conditions d’application: n= n1+ n2 ≥30, tous les Ti ≥ 5 H0: ces répartitions sont homogènes Calcul de la variable testée (X2): Calcul des effectifs théorique: SOi (Totaux des lignes )* Soi (totaux des colonnes ) Total général
5- Degré de liberté: (d.d.l)= (L-1)*(C-1)= 3 (L= nombre de lignes et C nombre de colonnes dans le tableau) 6- X2 critique= f (α, d.d.l) : voir tableau X2 = 105,8 7- Conclusion: la valeur trouvée est très sup à la valeur seuil qui est de 7,81 on rejette donc H 0 Avec un risque infime d’erreur (p< 0,0001) . La fréquence d’utilisation du test n’est pas identique selon la religion des femmes enceintes .
CAS DE PETITS ECHANTILLONS Lorsque les effectifs sont trop petits, les conditions de validité du test X 2 ne sont plus respectées. Si un des ti< 5, le X2 n’est plus applicable. D'autres tests peuvent être utilisés : 1 - Chi-2 corrigé de Yates : Lorsqu’un des effectifs théoriques du tableau 2*2 est inférieur à 5, sans en être très éloigné, on peut utiliser le Χ2 corrigé de Yates qui suit, si H0 est vraie, une loi de Χ2 à 1ddl.
2
Xc =
(|Oi-ti|-1/2)²
Σ
i=1
ti
Conditions de validité : Au moins un des ti < 5 et tous les ti ≥ 3
2- Méthode exacte de Fisher : Lorsqu'au moins un des effectifs théoriques ti ≤ 3, le Χ 2 corrigé de Yates n’est plus applicable. On a alors recours au test exact de Fisher, plus complexe sur le plan numérique. Le test exact de Fisher est valide quelques soient les effectifs théoriques.