http://www.lescienze.it Le Scienze 83
Jessica Hullman e Jen Christiansen (
grafica
)
0 20 40 60 80
Gruppo A
Gruppo B
Gruppo C
Peso
Barra di errore: intervallo di confidenza al 95%
Margine di errore: banda di confidenza al 95%
130
140
150
160
170
30 40 50 60
Altezza
20 campioni ipotetici, ognuno costituito
dallo stesso numero di osservazioni - scelte
a caso - sulla popolazione (puntini neri)
La vera media della
popolazione, che può
essere stimata soltanto
prelevando dei campioni
Campioni: 12 3... ... 20
Media del
campione 1
Valore medio
50
45
40
35
30
25
Mediamente,
un intervallo di
confidenza al 95%
su 20 non contiene
la media della
popolazione (anche
se i calcoli sono
perfetti)
0 20 40 60
Gruppo A
Gruppo B
Gruppo C
Gruppo A
Gruppo C
Gruppo B
Nessuna quantificazione
Il modo meno efficace di presentare l’incertezza è evitare di
mostrarla. A volte i graphic designer cercano di compensare la
mancanza di un’indeterminazione definita scegliendo una tecnica
che implica una certa imprecisione, ma non la quantifica. Per
esempio, un designer potrebbe associare i dati a una variabile visiva
difficile da definire, per esempio un cerchio che fluttua nello spazio
(in alto), anziché a un punto in un grafico con un asse x e un asse
y. Questo approccio rende l’interpretazione del lettore più soggetta
a errori. In alternativa, alcuni scelgono di usare un programma
che crea l’impressione di un disegno fatto a mano o di uno schizzo
appena abbozzato (in basso). Entrambe le tecniche sono rischiose.
PRO
- Se i lettori sentono che un’infografica è difficile da quantificare o è
semplicemente approssimativa, possono essere più cauti nel trarre
conclusioni o nel prendere decisioni basate su di essa.
CONTRO - I lettori possono non capire che la visualizzazione vuole trasmettere
imprecisione e possono trarre conclusioni che contengono gravi
errori. - Anche se capiscono che il tipo di visualizzazione è stato scelto per
rappresentare l’incertezza, non hanno modo di quantificarla.
Gli intervalli
Gli intervalli sono forse il modo più comune per rappresentare un’incertezza quantificata.
Le barre di errore (in alto) e le bande di confidenza (in basso) sono molto note, ma anche se
possono sembrare precise e immediate, sono notoriamente difficili da interpretare in modo
corretto. Le ricerche mostrano che sono spesso fraintese anche dagli stessi scienziati.
PRO
- Sono ampiamente riconosciute come rappresentazione dell’incertezza.
- Offrono un formato semplice per esprimere la possibilità che esistano diversi valori.
- La scelta dell’intervallo può essere personalizzata per più domande sullo stesso insieme
di dati. Per esempio, quando si fanno inferenze sull’intervallo di valori in una popolazione,
sono utili gli intervalli basati sulla deviazione standard; per inferenze sull’intervallo di valori
di un indice come la media, sono appropriati intervalli basati sull’errore standard.
CONTRO - Ambiguità in ciò che si mostra: gli intervalli possono rappresentare la deviazione standard,
l’errore standard o qualcos’altro. Ognuno ha un’interpretazione diversa. - I lettori possono commettere i cosiddetti «errori interpretativi deterministici»: interpretare
gli estremi delle barre di errore come i valori più alti e più bassi delle misure, anziché
come stime che denotano incertezza. - Le barre di errore possono portare al «bias della barra», comune nei grafici a barre.
Nell’esempio in basso, i lettori possono pensare che i valori della barra a destra dei pallini
siano più probabili di quelli a sinistra. - E’ facile ignorare le aree di incertezza a favore della tendenza centrale, cosa che può
portare a decisioni sbagliate.
Che cos’è un intervallo di confidenza?
Un modo naturale di interpretare una barra di errore o una
banda di confidenza che denotino il 95 per cento di confidenza
è che l’intervallo in questione abbia una probabilità del 95 per
cento di contenere il valore vero. In realtà, i numeri si riferiscono
alla percentuale di intervalli di confidenza che includerebbero il
valore vero estraendo dai dati infiniti campioni casuali della stessa
dimensione, ogni volta costruendo un intervallo
al 95 per cento. Anche se in pratica questa
diffusa interpretazione può non cambiare
drasticamente le decisioni prese, il fatto
che persino gli scienziati commettano
errori del genere mostra quanto sia
difficile interpretare correttamente le
rappresentazioni grafiche dell’incertezza.