Come scegliere un livello di confidenza?


12

Uso spesso un livello di confidenza del 90%, accettando che ciò abbia un maggiore grado di incertezza rispetto al 95% o al 99%.

Ma ci sono delle linee guida su come scegliere il giusto livello di confidenza? O linee guida per i livelli di confidenza utilizzati in diversi settori?

Inoltre, nell'interpretazione e nella presentazione dei livelli di confidenza, ci sono delle guide per trasformare il numero in lingua? Ad esempio, come guide come questa per Pearson's r ( modifica: queste descrizioni sono per le scienze sociali):

http://faculty.quinnipiac.edu/libarts/polsci/Statistics.html

Aggiornare

Grazie per le risposte di seguito. Erano tutti MOLTO utili, perspicaci e istruttivi.

Inoltre, di seguito sono riportati alcuni articoli interessanti sulla scelta del livello di significatività (essenzialmente la stessa domanda) che ho riscontrato esaminando questa domanda. Convalidano quanto detto nelle risposte di seguito.

"Qual è il significato del significato 0,05?"

http://www.p-value.info/2013/01/whats-significance-of-005-significance_6.html

"Sulle origini del livello di significatività statistica .05"

http://www.radford.edu/~jaspelme/611/Spring-2007/Cowles-n-Davis_Am-Psyc_orignis-of-05-level.pdf

"Metodo scientifico: errori statistici"

http://www.nature.com/news/scientific-method-statistical-errors-1.14700

Risposte:


9

Oltre alla grande risposta di Tim, ci sono anche diverse ragioni per determinati intervalli di confidenza. In una sperimentazione clinica per la lacca, per esempio, vorresti essere molto sicuro che il tuo trattamento non avrebbe ucciso nessuno, diciamo il 99,99%, ma staresti perfettamente bene con un intervallo di confidenza del 75% che la tua lacca fa rimanere i capelli dritto.

In generale, gli intervalli di confidenza dovrebbero essere usati in modo tale da essere a proprio agio con l'incertezza, ma anche non così severi da abbassare il potere del tuo studio in irrilevanza. Un intervallo di confidenza del 90% significa che quando si ripete il campionamento ci si aspetterebbe che una volta ogni dieci intervalli generati non includa il valore reale. Sulla base di ciò che stai cercando, è accettabile? D'altra parte, se si preferisce un intervallo di confidenza del 99%, la dimensione del campione è sufficiente per evitare che l'intervallo sia inutilmente grande? (Spero che tu stia decidendo il livello di IC prima di fare lo studio, giusto?)

Nella mia esperienza (nelle scienze sociali) e da quello che ho visto di mia moglie (nelle scienze biologiche), mentre ci sono CI / significati una sorta di standard in vari campi e vari casi specifici, non è raro per la maggior parte del dibattito su un argomento dipende dal fatto che tu abbia impostato in modo appropriato il tuo intervallo di CI o il livello di significatività. Sono stato in riunioni in cui uno statistico ha pazientemente spiegato a un cliente che, sebbene possano desiderare un intervallo di confidenza bilaterale del 99%, perché i loro dati mostrino sempre un significato, dovrebbero aumentare di dieci volte il loro campione; e ho partecipato a riunioni in cui i clienti chiedono perché nessuno dei loro dati mostra una differenza significativa, dove spieghiamo loro pazientemente che è perché hanno scelto un intervallo alto - o viceversa, tutto è significativo perché è stato richiesto un intervallo inferiore.

Quello che suggerisco è di leggere alcuni dei principali articoli nel tuo campo (il più vicino possibile al tuo argomento specifico) e vedere cosa usano; combinalo con il tuo livello di comfort e la dimensione del campione; e quindi preparati a difendere ciò che scegli con quelle informazioni a portata di mano. A meno che tu non sia in un campo con regole molto rigide - sospetto che gli studi clinici siano gli unici ad essere così severi, almeno da quello che ho visto - non otterrai nulla di meglio. (E se ci sono regole rigide, mi aspetto che i principali articoli nel tuo campo lo seguano!)


5
α

2
@Alexis Sfortunatamente, per ogni poche migliaia di utenti, uno di loro probabilmente dimenticherà di non usare mai un accendino mentre si spruzza i capelli ...
Joe

2
"Un intervallo di confidenza del 90% significa che una volta su dieci troverai un valore anomalo." Questo è assolutamente sbagliato, a meno che non ti stia fraintendendo
Shadowtalker

2
90% IC significa che il 90% delle volte, la media della popolazione è all'interno dell'intervallo di confidenza e il 10% è al di fuori (da una parte o dall'altra) dell'intervallo. Quindi 1 volta su 10, la tua scoperta non include la vera media. Forse 'outlier' è la parola sbagliata (anche se gli EC sono spesso (mis) usati a tale scopo.)
Joe

@Joe, mi rendo conto che questa è una vecchia sezione di commenti, ma questo è sbagliato. Puoi avere un elemento della configurazione di qualsiasi livello di "confidenza" che non include mai il valore reale. Vedi qui: stats.stackexchange.com/a/26457/176202
Frans Rodenburg

20

La scelta di un intervallo di confidenza è una decisione soggettiva . Si può scegliere letteralmente qualsiasi intervallo di confidenza: 50%, 90%, 99,999% ... ecc E 'su quanta fiducia si fa che si desidera avere. Probabilmente i più comunemente usati sono IC al 95%.

Per quanto riguarda l'interpretazione e il link che hai fornito ... Questi tipi di interpretazioni sono semplificazioni eccessive . La correlazione è un buon esempio, perché in contesti diversi valori diversi possono essere considerati come correlazioni "forti" o "deboli", dai un'occhiata ad alcuni esempi casuali dal web :

  • Una volta ho chiesto a un chimico che stava calibrando uno strumento di laboratorio secondo uno standard quale valore del coefficiente di correlazione stesse cercando. "0.9 è troppo basso. Hai bisogno di almeno 0,98 o 0,99 ". Ha ottenuto il numero da un documento di orientamento del governo.
  • Una volta ho chiesto a un ingegnere che stava conducendo un'analisi di regressione di un processo di trattamento quale valore del coefficiente di correlazione stava cercando. "Qualsiasi cosa tra 0,6 e 0,8 è accettabile." Il suo professore universitario glielo disse.
  • Una volta ho chiesto a un biologo che stava conducendo un ANOVA delle dimensioni di topi di campo che vivono in terreni contaminati rispetto a quelli incontaminati quale valore del coefficiente di correlazione stava cercando. Non lo sapeva, ma il suo cutoff era 0,2 sulla base della più piccola differenza di dimensioni che il suo modello poteva rilevare con il numero di campioni che aveva.

Mi dispiace, ma non ci sono scorciatoie ...

Per avere un'idea più precisa degli intervalli di confidenza, puoi leggere di più su di essi, ad esempio qui , qui o qui .


1
Bella citazione. +1.
ameba dice di reintegrare Monica il

Quello che dici sulle descrizioni delle correlazioni è corretto. È interamente correlato al campo. Le descrizioni nel link sono per le scienze sociali. Suppongo che una descrizione dell'intervallo di confidenza dipenda anche dal campo.
Oliver Moran,

9

Sebbene, generalmente, i livelli di confidenza siano lasciati alla discrezione dell'analista, ci sono casi in cui sono stabiliti da leggi e regolamenti. Ti darò due esempi.

Nella vigilanza bancaria è necessario utilizzare un livello di confidenza del 99% quando si calcolano determinati rischi, vedere p.2 nel presente regolamento di Basilea .

La FDA può incaricare di utilizzare determinati livelli di confidenza per i test sui farmaci e sui dispositivi nelle loro metodologie statistiche.

Nel complesso, è una buona pratica consultare l'esperto nel proprio campo per scoprire quali sono le pratiche e le normative accettate relative ai livelli di confidenza.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.