Ho avuto una discussione con uno statistico nel 2009 in cui ha affermato che il valore esatto di un valore p è irrilevante: l'unica cosa importante è se è significativo o meno. Cioè un risultato non può essere più significativo di un altro; i tuoi campioni, ad esempio, provengono dalla stessa popolazione o no.
Ho qualche scrupolo con questo, ma forse posso capire l'ideologia:
La soglia del 5% è arbitraria, ovvero che p = 0,051 non è significativo e che p = 0,049 lo è, non dovrebbe davvero cambiare la conclusione della tua osservazione o esperimento, nonostante un risultato sia significativo e l'altro non significativo.
Il motivo per cui lo sostengo ora è che sto studiando per un Master in Bioinformatica, e dopo aver parlato con le persone sul campo, sembra esserci un determinato impulso per ottenere un valore p esatto per ogni serie di statistiche che fanno. Ad esempio, se 'raggiungono' un valore p di p <1,9 × 10 -12 , vogliono dimostrare quanto sia significativo il loro risultato e che questo risultato è SUPER informativo. Questo problema è esemplificato da domande come: Perché non riesco a ottenere un valore p inferiore a 2.2e-16? , per cui vogliono registrare un valore che indica che per caso questo sarebbe MOLTO meno di 1 su un trilione. Ma vedo poca differenza nel dimostrare che questo risultato si verificherebbe meno di 1 su un trilione rispetto a 1 su un miliardo.
Posso apprezzare quindi che p <0,01 mostra che c'è meno dell'1% di probabilità che ciò accada, mentre p <0,001 indica che un risultato come questo è ancora più improbabile del suddetto valore p, ma le tue conclusioni tratte dovrebbero essere completamente diverso? Dopotutto sono entrambi valori p significativi. L'unico modo in cui posso concepire di voler registrare il valore p esatto è durante una correzione di Bonferroni in base alla quale la soglia cambia a causa del numero di confronti effettuati, riducendo così l'errore di tipo I. Ma ancora, perché dovresti mostrare un valore p inferiore di 12 ordini di grandezza rispetto alla tua soglia?
E l'applicazione della correzione Bonferroni in sé non è anch'essa leggermente arbitraria? Nel senso che inizialmente la correzione è vista come molto conservativa, e quindi ci sono altre correzioni che si possono scegliere per accedere al livello di significatività che l'osservatore potrebbe usare per i loro confronti multipli. Ma a causa di ciò, non è il punto in cui qualcosa diventa significativo essenzialmente variabile a seconda delle statistiche che il ricercatore vuole usare. Le statistiche dovrebbero essere così aperte all'interpretazione?
In conclusione, le statistiche non dovrebbero essere meno soggettive (anche se immagino che la necessità di essere soggettive sia una conseguenza di un sistema multivariato), ma alla fine voglio un chiarimento: qualcosa può essere più significativo di qualcos'altro? E p <0,001 sarà sufficiente rispetto al tentativo di registrare il valore p esatto?