Qualche idea sul perché non utilizziamo cifre significative nelle statistiche? Qualcosa sulla falsariga di noi stiamo usando le stime, quindi le regole sulla precisione non si applicano;)?
Qualche idea sul perché non utilizziamo cifre significative nelle statistiche? Qualcosa sulla falsariga di noi stiamo usando le stime, quindi le regole sulla precisione non si applicano;)?
Risposte:
Cifre significative sono usate in alcuni campi (ho imparato a conoscerli in Chimica) per indicare il grado di precisione significativa che esiste in un numero. Questo è un argomento importante anche nelle statistiche, quindi in effetti lo segnaliamo costantemente - lo segnaliamo solo in una forma diversa. In particolare, riportiamo intervalli di confidenza , che indicano il livello di precisione di una stima (come una media).
Dopo aver elencato l'IC 95% per un preventivo, ad esempio , puoi elencare tutte le cifre che desideri per la tua media, ad esempio 0,50129519823975923 , e non ci sono problemi. In effetti, lo statistico Andrew Gelman ha raccomandato di elencarne almeno quattro (2009, p. 4) .
Un motivo per limitare il numero di cifre riportato in molte stime, valori p, ecc. È basato sulla percezione. Segnalare qualcosa come p = 0,04872429 implica un livello di precisione nei risultati che li fa percepire come più accurati .
In sostanza, l'uso di un elevato numero di cifre nel riportare risultati statistici ha un sapore troppo grande nel tentativo di nascondere le tue scoperte in un'aria immeritata di autorità.
Penso che dipenda davvero dal livello di confidenza richiesto, meno cifre per la significatività sono appropriate per il 95%, rispetto al 99,999% o superiore, ad esempio, come usato dal CERN per molti dei loro risultati.
Stai parlando di arrotondare i dati a un numero di cifre significative o arrotondare la risposta finale? Se arrotondi i tuoi dati puoi entrare in situazioni in cui hai gettato via il rumore che i calcoli statistici devono usare.