1er khi 2 r ®sidents 1 ann ®e farah

Page 1

Enseignement de post graduation d’épidémiologie 1ère année

Le test du khi deux (X2)


Risques d’erreur statistique et test statistique


Origine de la problĂŠmatique


Fluctuations aléatoires Échantillon 1 48%

Obtenir pile à pile ou face (Probabilité = 50%)

Échantillon 2 52%

Échantillon 3 50%

Échantillon 4 45%


Fluctuations aléatoires Échantillon 1 9%

Même type de patients (Probabilité d'AVC = 12%)

Échantillon 2 12%

Échantillon 3 16%

Échantillon 4 26%


Fluctuations aléatoires d'échantillonnage • Fortes pour des effectifs petits et moyens • Faibles pour des grands effectifs • Jamais nulles


• Conséquences pour la comparaison de 2 échantillons – les proportions observées dans 2 échantillons peuvent être différentes – uniquement du fait du hasard – même si dans ces 2 échantillons la vraie probabilité était la même


Conséquences des fluctuations Effet du traitement = 0 Vrai risque = 10%

Vrai risque = 10%

Groupe T+

Groupe T-

Risque observé = 6%

Risque observé = 12%

Différence observée = -6%


Problématique des comparaisons • Quand on ignore la réalité, la différence observée de -6% est-elle ? – une manifestation des fluctuations aléatoires, donc due uniquement au hasard – la traduction d’une réelle différence entre les deux groupes, donc d’un effet non nul du traitement

• Comment départager ces 2 possibilités ? •

Solution : test statistique

.


But des comparaisons • Quel est le but des comparaisons ? Grp T

diff -6%

Conclure à l'existence d'une différence

Décider d'utiliser le nouveau traitement

Grp C

La conclusion doit être conforme à la réalité mais elle se base uniquement sur l’observé


Effets des fluctuations dans une comparaison • Le hasard peut faire apparaître une différence qui n'existe pas en réalité • Inversement, le hasard peut réduire une différence qui existe réellement • donc 2 façons de fausser la conclusion


Risques d’erreur statistique


Risques de conclusions erronées • Deux risques d'erreur – Risque alpha – Risque bêta

• Erreurs statistiques – dues uniquement au hasard


Erreur statistique alpha • Conclure à l'existence d'une différence qui n'existe pas en réalité : faux positif Échantillon 1 7.5%

Différence non réelle

Vrai valeur 12% Échantillon 2 15%


Erreur statistique bêta • Ne pas conclure à une différence qui existe pourtant en réalité : faux négatif Vrai valeur 12%

Échantillon 1 15%

Fausse absence de différence Vrai valeur 19%

Échantillon 2 15%


Risques d'erreur statistiques • Risque alpha : risque de conclure à une différence qui n’existe pas • Risque bêta : risque de ne pas mettre en évidence une différence qui existe réellement • Puissance : 1 - bêta : probabilité de mettre en évidence une différence qui existe réellement


Application à l’essai thérapeutique • Risque alpha : considérer comme efficace un traitement qui ne l’est pas • Risque bêta : ne pas conclure alors que le traitement est efficace • Puissance : montrer l’efficacité d’un traitement réellement efficace


Conclusion

Réalité

Différence Différence Pas de différence

Pas de différence Erreur bêta

Erreur alpha


Signification statistique Différence significative p<0.05 Il est peu probable que la différence observée soit due au hasard Différence observée

Test Différence non significative p>0.05 La probabilité que la différence observée soit due au hasard est forte

Seuil de signification statistique


Le test statistique • Donne une règle permettant de décider si l’on peut rejeter une hypothèse, en fonction des observations relevées sur des échantillons.

 Poser une hypothèse

Hypothèse nulle : notée H0 définie comme une absence de différence Hypothèse alternative : hypothèse concurrente, notée H1

 Analyser la compatibilité de cette hypothèse avec les observations issues de l’expérience.


Le test du khi2 ( X² )


• Il s’agit d’une mesure d’association statistique. • Le X2 teste la liaison entre deux variables qualitatives. • Il s’applique à tous les tableaux de contingence quel que soit le nombre de modalités des deux variables qualitatives. • Le calcul du X2 ne considère que les effectifs, jamais les fréquences relatives.


• Selon la situation, on distingue:  Le test de X2 de conformité ou d’ajustement qui sert à compare une distribution observée sur un échantillon à une distribution connue dans une population ou à une distribution théorique.  Le test de X2 d’homogénéité qui sert à comparer deux ou plusieurs distributions observées sur des échantillons.


Les différences constatées entre la distribution théorique et la distribution expérimentale restent-elles dans les limites des fluctuations de l’échantillonnage ou ces différences sont trop importantes pour être mises sur le compte du hasard?

Test du X² 1/ Le risque α= 5% 2/ Validité du test

tous les Ti ≥ 5, STi= SOi

tous les Ti ≥5, STi= SOi

Conformité entre distribution observée et distribution théorique

Calcul de l’effectif théorique= %théorique* SOi

Homogénéité entre deux ou plusieurs distributions observées

X2= S (Ti-Oi) 2 Ti

Calcul de l’effectif théorique= SOi (verticale)* SOi (horizontale) n X2= S (Ti-Oi) 2 Ti

d.d.l= K-1

d.d.l.= (L-1)(C-1)

4/ Calcul du X2

X² d’homogénéité ou d’indépendance

X² de conformité ou d’ajustement

3/ Hypothèse nulle: H0

5/ Degré de liberté: d.d.l. 6/ Détermination du X2 tabulaire ou critique X2c (α, d.d.l) K: nombre de classes

7/ Conclusion:

L: nombre de lignes, C: nombre de colonnes


Si H0

X² c ≥ X² t est rejetée

Si X² c < X² t H0 est retenue

------ Différence significative

au risque α

------ Différence non significative au risque α

Lorsque le test est significatif, il est d’usage de quantifier le degré de signification du test (p) Le degré de signification est la plus petite taille du test qui aurait permis avec ces données de rejeter le test (il s’agit d’une probabilité a posteriori).


Test de conformitĂŠ


Définition: Le test du X² de conformité consiste à comparer: 2 distributions: une observée à une autre théorique dans le cas du caractère qualitatif. Hypothèses: – Hypothèse nulle : • Les écarts constatés entre les effectifs observés et théoriques sont le fait du hasard. • La distribution observée suit la loi de probabilité théorique. • Il n’y a pas de différence. • Différence non significative. – Hypothèse alternative • La distribution observée ne suit pas la loi de probabilité théorique considérée. • Il existe une différence significative.


Calcul statistique – Tableau de contingence

Classe

A

B

C

D

Effectif

O1

O2

O3

O4

T1

T2

T3

T4

Observé Effectif Théorique

• Degré de liberté : – Nombre de classes – 1 soit d.d.l=K-1 • Conditions d’application: – Tous les effectifs théoriques doivent être supérieurs à 5. – Si les conditions ne sont pas remplies, il faut, quand cela est possible, regrouper logiquement des classes ou prendre d’autres méthodes. • Calcul du Khi 2:

K (0i-Ti)2

Khi2 = S i=1

Ti

Calcul de l’effectif théorique = % théorique ×SOi


Sur un échantillon de 284 sujets, on a observé la structure par âge ci-dessous (Oi). On veut vérifier si cet échantillon diffère de la structure par âge de la population générale (%pop). Age

Effectifs observés (Oi)

Proportions %pop

0-19 20-39 40-59 60-74 >74 Total

73 82 75 36 18 284

24,6 28,1 26,0 13,6 7,7 100

Effectifs théorique (Ti) 284 × % pop 69,9 79,8 73,8 38,6 21,9 284

Calcul de l’effectif théorique = % théorique ×SOi


Solution: 1234-

Calcul de l’effectif théorique= % théorique* SOi Le risque α= 5% Conditions d’application: tous les Ti ≥ 5 H0: la distribution par âge de l’échantillon est identique à celle de la population Calcul de la variable testée (X2):

Calcul du X2= (73-69,9)2 + (82-79,8)2 + (75-73,8)2 + (36-38,6)2+ (18-21,9)2 = 1,09 69,9 79,8 73,8 38,6 21,9 5- Degré de liberté: (d.d.l)= K-1= 5-1= 4 (K= nombre de colonnes dans le tableau) 6- X2 critique= f (α, d.d.l) : voir tableau 7- Conclusion: X2 < X2 critique (1,09 < 9,49) La différence est non significative au risque 5% On ne rejette donc pas H0 . Bien qu’on puisse jamais affirmer qu’une hypothèse nulle est vraie, on peut cependant considérer l’échantillon est représentatif de la population .



Test d’ homogénéité


Définition: • le test du X² d’homogénéité (ou d’indépendance) consiste à comparer 2 ou plusieurs distributions observées suivant plusieurs caractères qualitatifs. Hypothèses: – Hypothèse nulle : • Les écarts constatés entre les distributions sont le fait du hasard. • Il n’y a pas de différence. • Différence non significative. – Hypothèse alternative • Il existe une différence significative.


Calcul statistique

A

B

C

D

Distribution1

O1 T1

O2 T2

O3 T3

O4 T4

Distribution2

O5 T5

O6 T6

O7 T7

O8 T8

Distribution i

O.. T..

O.. T..

O.. T..

O.. T..

– Tableau de contingence

• Degré de liberté : – degré de liberté: DDL =γ=(L-1)(C-1) avec L= nombre de lignes et C= nombre de colonnes. • Conditions d’application: – Tous les effectifs théoriques doivent être supérieurs à 5, ∑Oi =∑Ti =n . • Calcul du Khi 2: K (0i-Ti)2 Khi2 = S i=1

Ti

Calcul de l’effectif théorique =


Le X2 d’homogénéité: exemple Le test de dépistage pour le virus du VIH est proposé systématiquement lors d’une grossesse. On désire savoir si la fréquence d’acceptation du test varie selon la religion de la femme enceinte .

Religion

A

B

C

D

Total

Test effectué

477

1746

248

135

2606

Test non fait

135

582

218

67

1002

Total

612

2328

466

202

3608

% tst eff

77,9

75

53,2

66,8


Solution: 1234-

Le risque α= 5% Conditions d’application: n= n1+ n2 ≥30, tous les Ti ≥ 5 H0: ces répartitions sont homogènes Calcul de la variable testée (X2): Calcul des effectifs théorique: SOi (Totaux des lignes )* Soi (totaux des colonnes ) Total général

5- Degré de liberté: (d.d.l)= (L-1)*(C-1)= 3 (L= nombre de lignes et C nombre de colonnes dans le tableau) 6- X2 critique= f (α, d.d.l) : voir tableau X2 = 105,8 7- Conclusion: la valeur trouvée est très sup à la valeur seuil qui est de 7,81 on rejette donc H 0 Avec un risque infime d’erreur (p< 0,0001) . La fréquence d’utilisation du test n’est pas identique selon la religion des femmes enceintes .



CAS DE PETITS ECHANTILLONS Lorsque les effectifs sont trop petits, les conditions de validité du test X 2 ne sont plus respectées. Si un des ti< 5, le X2 n’est plus applicable. D'autres tests peuvent être utilisés : 1 - Chi-2 corrigé de Yates : Lorsqu’un des effectifs théoriques du tableau 2*2 est inférieur à 5, sans en être très éloigné, on peut utiliser le Χ2 corrigé de Yates qui suit, si H0 est vraie, une loi de Χ2 à 1ddl.

2

Xc =

(|Oi-ti|-1/2)²

Σ

i=1

ti

Conditions de validité : Au moins un des ti < 5 et tous les ti ≥ 3


2- Méthode exacte de Fisher : Lorsqu'au moins un des effectifs théoriques ti ≤ 3, le Χ 2 corrigé de Yates n’est plus applicable. On a alors recours au test exact de Fisher, plus complexe sur le plan numérique. Le test exact de Fisher est valide quelques soient les effectifs théoriques.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.