Pro-Test Italia

Cosa vuol dire che un dato è (o non è) significativo?

Un utente ci chiede di spiegare cosa si intende dicendo che un dato è (oppure non è) significativo. Vediamo come possiamo riuscire a spiegarlo in maniera semplice e senza troppa matematica.
Ci scusiamo sin d’ora con i matematici se per semplificare troppo commettiamo degli errori: se li trovate segnalateceli, che così correggiamo l’articolo.

Il sistema biologico non è un sistema matematicamente semplice. Ogni volta che si misura qualcosa o si fa un esperimento le variabili sono milioni ed alcune cose potrebbero capitare per caso. Faccio un esempio con un mezzo più semplice da capire.

Lanciamo una moneta.

La probabilità che esca testa è di ½. Quindi, in teoria, se faccio 100 lanci, mi dovrei aspettare, più o meno, il 50% di testa ed il 50% di croce.
Come avete visto, però, ho scritto più o meno, perchè non otterrò sempre 50 lanci con testa e 50 lanci con croce.
Ma, se ripeto i 100 lanci N volte, otterrò una serie di numeri: alcune volte otterrò 50 teste, altre 51, o 52, o 53 o 49, 48, 47 e così via. Se ripeto molte volte la procedura, alla fine mi ritroverò con una serie di numeri che, più o meno, saranno attorno al 50.

Adesso, immaginiamo di avere una moneta nuova.
Che potrebbe essere buona (probabilità 50/50) oppure truccata, perché magari ha il baricentro sfalsato per favorire l’uscita della testa. Io non posso sapere se la moneta è truccata o meno, allora ripeto la mie serie di lanci.
Diciamo che dopo aver lanciato la mia moneta un congruo numero di volte in serie da 100, mi ritrovo che la media è di 60 volte testa e 40 croce.

Come faccio a capire se la mia media (60, in questo caso) è dovuta al caso oppure è indice di una moneta truccata? Che tradotto in farmaci vuol dire: come faccio a sapere se (ad esempio) la variazione di difetti nello sviluppo embrionale è dovuto al caso oppure è dovuto al farmaco?

Per fare questo si applica un parametro che viene detto significatività. La distribuzione dei dati che ho menzionato prima, segue, più o meno, questa distribuzione:
Le scritte che si vedono in basso si chiamano deviazioni standard: +1 o -1 sono una deviazione standard. Maggiore è la dispersione dei dati e maggiore è la deviazione standard.
Lo spazio tra ± 1 deviazione standard comprende circa il 68% del campione, 2 deviazioni standard comprendono circa il 95% del campione e 3 deviazioni standard compendono attorno al 99% del campione. Più il dato è distante dal centro, maggiore è la probabilità che non sia dovuto al caso.

Di solito, un dato si intende significativo se dista almeno due deviazioni standard dal dato atteso (il punto segnato con lo 0). Se il dato è distante 3 deviazioni standard, si dice altamente significativo.
Sotto le due deviazione standard il dato è NON significativo e, con tutta probabilità, si può ritenere dovuto al caso.

[Dott. Dario Padovan – Comitato Scientifico Pro-Test Italia]

Licenza Creative Commons
Quest’opera è distribuita con Licenza Creative Commons Attribuzione – Non commerciale – Non opere derivate 3.0 Italia.

Advertisements

I commenti sono chiusi.

%d blogger hanno fatto clic su Mi Piace per questo: