Capitolo 10
Indipendenza, connessione e associazione Cioè l’analisi statistica congiunta di una coppia di fenomeni qualitativi
Passando dall’analisi statistica monovariata all’analisi bivariata l’obiettivo diventa studiare, oltre al comportamento monovariato dei singoli fenomeni considerati separatamente, anche il loro comportamento congiunto, rilevando l’eventuale relazione esistente fra i due fenomeni e, quando la relazione esiste, cercando di misurarla e spiegarla statisticamente. In questo capitolo considereremo fenomeni statistici di qualunque natura, cioè sia qualitativi che quantitativi perché lavoreremo sulle frequenze. Per i fenomeni quantitativi disponiamo, però, di una strumentazione statistica più ampia e articolata (lo vedremo nei prossimi Capitoli 11 e 12), perciò i concetti e gli strumenti che introdurremo in questo capitolo sono particolarmente adatti all’analisi statistica congiunta di una coppia di fenomeni qualitativi. In ogni caso, qualunque sia la natura dei due fenomeni, il primo passo nell’analisi della loro relazione statistica consiste nello stabilire se esiste una qualche relazione. Partiamo da qui.
10.1 Indipendenza statistica Se fra X e Y non esiste alcuna relazione statistica, allora X e Y sono statisticamente indipendenti. Il metodo per stabilire se X e Y sono indipendenti consiste nel confrontare le frequenze condizionate, che informano sul comportamento di un fenomeno condizionatamente alle modalità dell’altro, con le frequenze marginali, che invece informano sul comportamento dei due fenomeni indipendentemente l’uno dall’altro. L’unico accorgimento consiste nel tener conto che le frequenze marginali si riferiscono all’intera U di numerosità N mentre le frequenze condizionate si riferiscono a sotto-popolazioni di numerosità fi. (se guardiamo le righe, cioè Y |xi ) o a sotto-popolazioni di numerosità f.j (se guardiamo le colonne, cioè X|yj ). Il confronto, come sappiamo, è possibile solo fra frequenze relative. Le frequenze condizionate sono già relative per costruzione. Le frequenze marginali relative si ottengono dalle frequenze marginali assolute dividendo per N (lo abbiamo già visto nel Capitolo 9): fi. /N per X e f.j /N per Y . Concentriamoci, per esempio, sulle righe, cioè sulle k v.s. condizionate Y |xi (ma tutto quello che diremo vale, con gli adattamenti che servono nella notazione e nell’interpretazione, anche per le colonne, cioè le h v.s. condizionate X|yj ). Se tutte le k serie di frequenze condizionate fij /fi. sono uguali fra loro e uguali alla marginale (relativa) f.j /N, significa che, sia condizionatamente alle k modalità xi di X sia marginalmente (cioè indipendentemente da X), Y si comporta alla stessa maniera. Ne deduciamo che X e Y sono statisticamente indipendenti, cioè non c’è nessuna relazione statisticamente rilevabile fra X e Y .