Perché non usiamo cifre significative?


18

Qualche idea sul perché non utilizziamo cifre significative nelle statistiche? Qualcosa sulla falsariga di noi stiamo usando le stime, quindi le regole sulla precisione non si applicano;)?


1
I lettori possono anche trovare questa discussione: numero di cifre significative da mettere in una tabella di interesse.
gung - Ripristina Monica

Ho trovato questa informativa: davegiles.blogspot.com/2011/12/…
John

Un esempio in cui prestare attenzione a cifre significative è davvero importante appare in stats.stackexchange.com/questions/113314 , in cui l'OP ha ottenuto risultati di regressione notevolmente diversi riconducibili a differenze nella precisione con cui i dati sono stati inseriti nelle procedure di regressione.
whuber

Risposte:


19

Cifre significative sono usate in alcuni campi (ho imparato a conoscerli in Chimica) per indicare il grado di precisione significativa che esiste in un numero. Questo è un argomento importante anche nelle statistiche, quindi in effetti lo segnaliamo costantemente - lo segnaliamo solo in una forma diversa. In particolare, riportiamo intervalli di confidenza , che indicano il livello di precisione di una stima (come una media).

Dopo aver elencato l'IC 95% per un preventivo, ad esempio , puoi elencare tutte le cifre che desideri per la tua media, ad esempio 0,50129519823975923 , e non ci sono problemi. In effetti, lo statistico Andrew Gelman ha raccomandato di elencarne almeno quattro (2009, p. 4) . (0.12,1.12)0.50129519823975923


(L'ultima parte è la lingua sulle guance, scusate la mia irriverenza ;-).
gung - Ripristina Monica

2
+1. Un gran numero di cifre sembra generare risposte irriverenti: vedi le ultime righe della mia risposta a una domanda simile su un altro sito SE.
whuber

@gung Come decidi di rappresentare gli endpoint dell'IC con due decimali?
user765195,

@ user765195, ho inventato quei numeri. In realtà non si riferiscono a nulla.
gung - Ripristina Monica

@gung Quello che intendevo chiedere era che qual è la precisione degli end point di un elemento della configurazione? Quante cifre sono valide, ad esempio, quando si calcola un Wilson CI per una proporzione binomiale?
user765195,

12

Un motivo per limitare il numero di cifre riportato in molte stime, valori p, ecc. È basato sulla percezione. Segnalare qualcosa come p = 0,04872429 implica un livello di precisione nei risultati che li fa percepire come più accurati .

In sostanza, l'uso di un elevato numero di cifre nel riportare risultati statistici ha un sapore troppo grande nel tentativo di nascondere le tue scoperte in un'aria immeritata di autorità.


1

Penso che dipenda davvero dal livello di confidenza richiesto, meno cifre per la significatività sono appropriate per il 95%, rispetto al 99,999% o superiore, ad esempio, come usato dal CERN per molti dei loro risultati.


Per ulteriori chiarimenti, l'articolo di Wikipedia su Precisione e Precisione sarebbe una buona lettura per il poster originale.
Robert Jones,

questo è un buon punto, ma anche quando 𝛂 = .05 l'arrotondamento in alcuni calcoli può avere un grande effetto sul risultato.
timothy.s.lau,

1

Stai parlando di arrotondare i dati a un numero di cifre significative o arrotondare la risposta finale? Se arrotondi i tuoi dati puoi entrare in situazioni in cui hai gettato via il rumore che i calcoli statistici devono usare.


Intendo sia le risposte finali che i calcoli intermedi sono in genere arrotondati anche nei libri di testo.
timothy.s.lau,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.