N.4 – Aprile 2017
la somma richiesta per il suo acquisto. In maniera analoga nelle presentazione di dati statistici sociali, economici, medici è necessario conoscerne i valori centrali (media, mediana e moda) ma anche la loro misura di dispersione o concentrazione intorno ad essi, senza trascurare le dimensioni dei campioni a confronto e la loro rappresentatività rispetto alla popolazione generale, così come l’identità di chi ha commissionato l’indagine.
Mentire con le statistiche di Paolo Salvatore Polizzi
Oltre mezzo secolo fa lo scrittore americano Darrell Huff ha pubblicato il libro “Mentire con le Statistiche” riscuotendo un notevole successo tanto da essere tradotto in ventidue lingue tra le quali anche l’italiano (pubblicato da M&A editore, traduzione di G. Livraghi e R. Puglisi ). Il suo contenuto rimane attuale ancora oggi e costituisce uno strumento chiaro e semplice per orientarsi nel mare delle notizie mediche, sociali, economiche e finanziarie regolarmente corredate di statistiche e grafici. I dati statistici possono essere un valido aiuto nella gestione quotidiana dei rischi e nella ricerca di soluzioni ai problemi complessi ma è altrettanto importante conoscerne i limiti. Il libro di Huff invita a prestare maggiore attenzione ai possibili errori statistici e con questo proposito fornisce consigli pratici per mettere in atto quella che lui stesso definisce la “seconda occhiata”. Il termine Statistica comprende quella parte della matematica che permette di riassumere e semplificare delle realtà complesse. Grazie ai metodi statistici i dati ricavati da un campione rappresentativo di una popolazione generale possono essere analizzati e trasformati in una visione d’insieme meno confusa ma anche più esposta al rischio di interpretazioni forzate ed errori di elaborazione. Per questo motivo una presentazione statistica deve riportare delle medie ma anche diversi parametri e specifiche. Quando si acquista un prodotto come ad esempio un automobile non ci si può fermare al solo colore e alla forma aerodinamica ma è necessario conoscerne le sue caratteristiche meccaniche, le prestazioni ed i consumi per poter maturare un giudizio complessivo sulla opportunità di investire
All’interno di una popolazione i dati hanno la tendenza a raccogliersi intorno a dei valori centrali definiti “medie” e se parliamo ad esempio della statura media si intuisce subito il riferimento all’altezza più comune in confronto al minor numero di individui più bassi o più alti rispetto ad essa. Il discorso diviene meno chiaro se la distribuzione dei dati è asimmetrica come nel caso degli stipendi all’interno di un’azienda o in uno stato, dove è necessario specificare il tipo di valore medio riportato, se è cioè una media aritmetica, una mediana o una moda, dato che la prima è influenzata dai valori estremi a differenza della mediana, che invece si colloca esattamente a metà di una serie di valori disposti in ordine crescente o decrescente, e della moda, che si riferisce al valore più frequente. Così ad esempio se in un’azienda con mille operai lo stipendio di ognuno di loro è 1200 euro al mese e solo cinque dirigenti guadagnano mensilmente 100.000 euro, lo stipendio medio offerto dall’azienda si porterà a quasi 1700 euro (grazie ai cinque dirigenti con la super retribuzione che fanno volare in alto la media aritmetica calcolata dividendo il totale degli stipendi per il numero degli individui ) mentre usare la mediana o la moda renderebbe meno attraente ma anche più realistica l’azienda rimanendo ancorato alla realtà dei 1200 euro della gran parte dei compensi.
N.4 – Aprile 2017
Quanto riportato naturalmente può essere esteso agli argomenti più disparati, dagli investimenti immobiliari all’efficacia di un vaccino ma rimane incompleto senza ulteriori specifiche sul grado di dispersione dei valori rispetto al valore centrale della media. Gran parte dei dati di una popolazione tende a raggrupparsi attorno alla mediana ma è utile misurare a quale distanza si trovino rispetto ad essa. A questo proposito l’autore tratta l’argomento della variabilità dei dati a causa degli inevitabili errori connessi alla misurazione dei campioni e definiti errore standard, a sua volta collegato alla varianza e alla deviazione standard, invitando il lettore a “pensare per gamma” piuttosto che accettare come assoluta una singola cifra esatta. In breve si ricorda che la varianza - o scarto quadratico medio - si ottiene dividendo la somma delle diverse deviazioni dalla media elevate al quadrato per la somma del numero di osservazioni effettuate, mentre la radice quadrata della varianza rappresenta la deviazione standard ed è quest’ultima infine che permette di misurare l’errore standard che rappresenta una stima della probabile deviazione standard delle medie da un numero infinito di campioni (secondo la definizione riportata nel sito IBM.com). Huff spiega la misura dell’errore standard usando l’esempio del Quoziente Intellettivo definito come “campionamento dell’intelletto umano” ed in quanto tale con le inevitabili imprecisioni presenti in ogni campionamento, in questo caso si ha un errore di probabilità del tre per cento. Questo significa che un individuo che ottenga ad esempio un risultato del QI pari a 100 dovrebbe vedere riportato il proprio risultato finale in maniera poco definita rispetto a come avviene di solito, ovvero il QI è di 100 più o meno 3, quindi con una ampiezza del punteggio del quoziente intellettivo oscillante da 97 a 103, proprio a causa del suddetto errore standard del 3%. Normalmente invece si assiste a delle semplificazioni
dei risultati con il singolo numero finale che ha l’effetto di convincere e impressionare di più il lettore. L’autore in vari punti del suo libro invita a diffidare delle ricerche che presentano dei risultati finali esatti fino alla virgola, simili a sentenze definitive che sembrano chiudere l’argomento e senza aggiungere altri parametri statistici. Altro punto notevole del libro è quello della presentazione visiva del risultato finale che può rispettare le proporzioni numeriche o stravolgerle per impressionare visivamente e convincere l’osservatore.
Altri autori concordano sull’importanza dei grafici, come ad esempio gli statistici americani D.M. Levine , T.C. Krehbiel e M.L. Berenson che nel loro libro “Statistica” edito nel 2006 da Apogeo, considerano necessari i grafici come ulteriore sintesi per comprendere al meglio i dati, ma rilevano come “molti grafici presenti su giornali e riviste” possano essere “scorretti, ingannevoli o complicati” a causa dell’uso di icone tridimensionali in grado di catturare l’attenzione del lettore ma anche di distorcere i dati; per questo motivo gli autori riportano una sintesi delle “linee guida dell’eccellenza grafica” secondo le quali il grafico deve essere il più semplice possibile, senza abbellimenti e deve specificare la scala di ogni asse. Anche Huff dedica un capitolo all’uso che il giornalismo sensazionalistico fa delle immagini a tre dimensioni per rappresentare i dati numerici. Questa tecnica serve solo a confondere il lettore che più facilmente diventerà disponibile ad accogliere l’idea che esistano delle differenze significative tra campioni o delle correlazioni tra cause ed effetti
N.4 – Aprile 2017 anche laddove non siano dimostrate in alcun modo. Il raddoppio delle dimensioni di un omino riportato nel grafico ne aumenta visivamente le dimensioni di otto volte incidendo efficacemente sulla psiche profonda del lettore. In questo modo la statistica diviene un utile strumento per manipolare la realtà e ottenere consenso.
Il libro di Darrel Huff, ricco di esempi pratici e riflessioni, riassume infine l’argomento con cinque semplici domande che ogni lettore farebbe bene a porsi per riconoscere la validità dei dati presentati dai mezzi di informazione: qual è la fonte che sostiene l’informazione? Quanto è adeguato e significativo il campione in esame? Quanto è affidabile in termini di cifre assolute? Vi sono modifiche e cambiamenti tra dati e conclusioni? Quanto è credibile la statistica in base alla precisione o arrotondamento dei dati? La finalità dichiarata dall’autore è quella di far “reagire alle statistiche” il lettore stimolandone il pensiero critico. Non una critica alla statistica, dunque, ma all’uso scorretto e di parte che se ne fa, talvolta, nei mezzi di comunicazione di massa.