Intervallo di confidenza ristretto: maggiore precisione?


18

Ho due domande sugli intervalli di confidenza:

Apparentemente un ristretto intervallo di confidenza implica che vi è una minore possibilità di ottenere un'osservazione all'interno di quell'intervallo, pertanto la nostra precisione è maggiore.

Anche un intervallo di confidenza al 95% è più stretto di un intervallo di confidenza al 99% che è più ampio.

L'intervallo di confidenza del 99% è più preciso del 95%.

Qualcuno può dare una semplice spiegazione che potrebbe aiutarmi a capire questa differenza tra accuratezza e ristrettezza?


2
Penso che intendi "c'è una minore possibilità di ottenere un'osservazione al di fuori di quell'intervallo". Sfortunatamente, un intervallo di confidenza potrebbe non significare ciò che sembra significare, a causa di problemi tecnici e statistici, ma in generale più stretto è l'intervallo (a un dato livello di confidenza), minore è l'incertezza sui risultati. Ci sono molti thread su questo sito che parlano del significato di un intervallo di confidenza (al contrario, diciamo, di un intervallo credibile). Non stiamo nemmeno entrando negli intervalli predittivi ...
Wayne,

@Wayne Perché la frase non è "c'è una minore possibilità di ottenere un'osservazione entro quell'intervallo"? Poiché l'intervallo ristretto presenta un errore di tipo 1 di grandi dimensioni, è più probabile che rifiuti l' ipotesi nulla vera , cioè il mio vero valore null non è contenuto in quell'intervallo. Quindi, mi sembra a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that intervalcorretto. Mi spiegheresti per favore dove sto facendo l'errore?
utente 31466

Risposte:


19

Il 95% non è affatto collegato numericamente a quanto sei sicuro di aver coperto il vero effetto nel tuo esperimento. Forse riconoscere che "intervallo usando il calcolo del range di copertura del 95%" potrebbe essere un nome più preciso per questo. È possibile effettuare la scelta per decidere che l'intervallo contiene il valore vero; e avrai ragione se lo fai costantemente il 95% delle volte. Ma davvero non sai quanto sia probabile per il tuo particolare esperimento senza ulteriori informazioni.

Q1: la tua prima query combina due cose e abusa di un termine. Nessuna meraviglia che tu sia confuso. Un intervallo di confidenza più stretto può essere più preciso ma, se calcolato nello stesso modo, come il metodo al 95%, hanno tutti la stessa precisione. Catturano il vero valore nella stessa proporzione del tempo.

Inoltre, solo perché è stretto non significa che hai meno probabilità di incontrare un campione che rientra in quello stretto intervallo di confidenza. Un intervallo di confidenza ristretto può essere ottenuto in tre modi. Il metodo o la natura sperimentale dei dati potrebbe avere una varianza molto bassa. L'intervallo di confidenza attorno al punto di ebollizione dell'acqua del rubinetto a livello del mare è piuttosto piccolo, indipendentemente dalle dimensioni del campione. L'intervallo di confidenza attorno al peso medio delle persone potrebbe essere piuttosto grande perché le persone sono molto variabili ma si può ridurre l'intervallo di confidenza acquisendo semplicemente più osservazioni. In tal caso, man mano che acquisisci più certezza su dove ritieni sia il vero valore, raccogliendo più campioni e facendo un intervallo di confidenza più stretto, quindi la probabilità di incontrare un individuo in quell'intervallo di confidenza diminuisce. (diminuisce in ogni caso quando si aumenta la dimensione del campione, ma non si può disturbare a raccogliere il campione grande nella custodia dell'acqua bollente). Infine, potrebbe essere stretto perché il campione non è rappresentativo. In tal caso, in realtà è più probabile che tu abbia uno del 5% di intervalli che non contiene il valore reale. È un po 'un paradosso per quanto riguarda la larghezza degli elementi della configurazione e qualcosa che dovresti controllare conoscendo la letteratura e la variabilità di questi dati. In tal caso, in realtà è più probabile che tu abbia uno del 5% di intervalli che non contiene il valore reale. È un po 'un paradosso per quanto riguarda la larghezza degli elementi della configurazione e qualcosa che dovresti controllare conoscendo la letteratura e la variabilità di questi dati. In tal caso, in realtà è più probabile che tu abbia uno del 5% di intervalli che non contiene il valore reale. È un po 'un paradosso per quanto riguarda la larghezza degli elementi della configurazione e qualcosa che dovresti controllare conoscendo la letteratura e la variabilità di questi dati.

Inoltre, considera che l'intervallo di confidenza riguarda il tentativo di stimare il vero valore medio della popolazione. Se conoscessi quel punto, saresti ancora più preciso (e accurato) e non avresti nemmeno una serie di stime. Ma la tua probabilità di incontrare un'osservazione con lo stesso identico valore sarebbe molto inferiore rispetto a trovarne una all'interno di un particolare CI basato su campioni.

Q2 : un intervallo di confidenza del 99% è più ampio di un 95%. Pertanto, è più probabile che conterrà il valore vero. Vedi la distinzione sopra tra preciso e preciso, stai combinando i due. Se restringo un intervallo di confidenza con una variabilità inferiore e una dimensione del campione più elevata, diventa più preciso, i valori probabili coprono un intervallo più piccolo. Se aumento la copertura utilizzando un calcolo del 99%, diventa più preciso, è più probabile che il valore reale sia compreso nell'intervallo.


2
La variabilità della media (= cosa stai cercando di stimare) nella popolazione è zero.
Nick Sabbe,

10

Per un determinato set di dati, l'aumento del livello di confidenza di un intervallo di confidenza comporterà solo intervalli più grandi (o almeno non più piccoli ). Non si tratta di accuratezza o precisione, ma piuttosto di quanto rischio sei disposto a correre a perdere il vero valore.

Se si confrontano gli intervalli di confidenza per lo stesso tipo di parametro da più set di dati e uno è più piccolo dell'altro, si potrebbe dire che quello più piccolo è più preciso . Preferisco parlare di precisione piuttosto che accuratezza in questa situazione (vedi questo rilevante articolo di Wikipedia ).


Cosa si intende per "stesso tipo di parametro" e "set di dati multipli"? Ad esempio, un sondaggio sull'analfabetismo e il sondaggio si svolgono in tempi diversi, 1995, 1998, ecc. Quindi il "tasso di analfabetismo" è lo stesso tipo di parametro e i set di dati del 1995, 1998, ecc. Indicano più set di dati?
utente 31466

Ad esempio, una serie di intervalli di confidenza, ciascuno per la media di alcune popolazioni. Anche il tuo esempio si adatta.
Karl,

3

Prima di tutto, un elemento della configurazione per una determinata percentuale di confidenza (ad es. 95%) significa, per tutti gli scopi pratici (anche se tecnicamente non è corretto) che sei sicuro che il vero valore sia nell'intervallo.

Se questo intervallo è "stretto" (si noti che può essere considerato solo in modo relativo, quindi, per un confronto con quanto segue, si supponga che sia largo 1 unità), significa che non c'è molto spazio per giocare: qualunque valore se prendi quell'intervallo sarà vicino al valore vero (perché l'intervallo è stretto) e ne sei abbastanza sicuro (95%).

Confronta questo con un IC al 95% relativamente ampio (per abbinare l'esempio precedente, supponiamo che sia largo 100 unità): qui, sei ancora sicuro al 95% che il valore vero sarà all'interno di questo intervallo, ma ciò non ti dice molto molto, poiché ci sono relativamente molti valori nell'intervallo (circa un fattore 100 rispetto a 1 - e chiedo, ancora, ai puristi di ignorare la semplificazione).

In genere, avrai bisogno di un intervallo più grande quando vuoi essere sicuro al 99% che il vero valore è in esso, rispetto a quando devi essere sicuro solo al 95% (nota: questo potrebbe non essere vero se gli intervalli non sono nidificati ), quindi, maggiore è la sicurezza di cui hai bisogno, più ampio sarà l'intervallo che dovrai scegliere.

D'altra parte, si è più certo con l'intervallo di confidenza più alto. Quindi, se ti do 2 intervalli della stessa larghezza e dico che uno è un IC al 95% e l'altro è un IC al 99%, spero che preferirai uno al 99%. In questo senso, gli IC del 99% sono più precisi: hai meno dubbi sul fatto di aver perso la verità.


Grazie! quindi quando dicono che questa nuova ricerca sui neutrini è più veloce della luce ha un intervallo di confidenza molto piccolo (suppongo che questo significhi stretto), allora ciò significa che è più probabile che siano precisi se si trattasse di un ampio intervallo di confidenza? (ignorando tutti gli altri aspetti)
sopra

10
Nick, la tua prima affermazione è sbagliata. Non è un "problema tecnico", non è corretto. L'intervallo di confidenza è un'affermazione su ciò che accadrebbe in esperimenti ripetuti, che coprirebbero il vero valore il 95% delle volte. Un'affermazione sulla fiducia che il vero valore rientra nel mio intervallo dato trovata nel mio esperimento dato non è affatto la stessa. Se togliessi "quello" in "quel confidente" e la cifra numerica tra parentesi, allora saresti più vicino alla verità. Potresti semplicemente dire che significa che credi che il vero valore possa cadere nell'intervallo.
Giovanni,

altrimenti, la risposta è abbastanza buona ...
John

4
@Giovanni: ho espressamente evitato di dire che l'intervallo stesso è la variabile casuale, anche se la mia frase non implica che non lo sia (lo ammetto, lo suggerisce). Conosco i problemi coinvolti, ma li ho trovati irrilevanti per la domanda. Non ho mai visto una situazione pratica in cui la differenza contava, quindi il "per tutti gli scopi pratici".
Nick Sabbe

4
Non hai riscontrato il problema? È come dire il valore p = la probabilità del null e poi dire che non hai mai riscontrato un problema con esso. Non lo farai se rimani nelle riviste giuste. È errato affermare che sei sicuro al 95% che il valore reale sia compreso nell'intervallo corrente. Considerarlo come una questione esoterica significa solo che ora avremo (almeno) un'altra persona che va in giro dicendo: "Sono sicuro al 95% che il valore sia compreso in questo intervallo". Difficilmente cambierebbe la tua risposta per correggerla. Le altre questioni che potresti affrontare potrebbero essere ignorate se modifichi quell'istruzione.
Giovanni,

3

Sto aggiungendo alcune buone risposte a cui ho dato voti. Penso che ci sia qualcosa di più da dire per chiarire completamente la conclusione. Mi piacciono i termini precisi e corretti come li definisce Efron. Di recente ho discusso a lungo su una domanda diversa. A un moderato piagnucolone piaceva davvero quella risposta. Non andrò allo stesso modo per ripeterlo qui. Tuttavia, la precisione di Efron riguarda il livello di confidenza e la correttezza della larghezza o della tenuta dell'intervallo. Ma non puoi parlare di tenuta senza prima considerare l'accuratezza. Alcuni intervalli di confidenza sono esatti quelli sono accurati perché hanno la copertura effettiva che pubblicizzano. Un intervallo di confidenza al 95% può anche essere approssimativo perché utilizza una distribuzione asintotica. Gli intervalli approssimativi basati su asintotici sono per una dimensione del campione finita n non avrà la copertura pubblicizzata che è la copertura che otterresti se la distribuzione asintotica fosse la distribuzione esatta. Quindi un intervallo approssimativo potrebbe essere coperto (cioè pubblicizzare il 95% quando la sua copertura effettiva è solo del 91%) o nel raro ma meno grave caso di copertura (cioè la copertura pubblicizzata è del 95% ma effettiva nel 98%). Nel primo caso ci preoccupiamo di quanto sia vicina la copertura effettiva alla copertura pubblicizzata). Una misura di vicinanza è l'ordine di accuratezza che potrebbe essere 1 / √n o 1 / n. Se il livello di confidenza attuale è vicino, lo definiamo accurato. Accuray è importante con intervalli di confidenza bootstrap che non sono mai esatti ma alcune varianti sono più accurate di altre.

Questa definizione di accuratezza può essere diversa da quella a cui si riferisce il PO ma ora dovrebbe essere chiaro qual è la definizione di Efron e perché è importante essere precisi. Ora, se hai due metodi esatti, possiamo preferire uno rispetto all'altro se per qualsiasi livello di confidenza ha la larghezza prevista più piccola. Un intervallo di confidenza che è meglio in questo senso (a volte chiamato il più breve) sarebbe quello da scegliere. Ma questo ha richiesto esattezza. Se il livello di confidenza è solo approssimativo, potremmo confrontare mele e arance. Uno potrebbe essere più stretto di un altro solo perché è meno preciso e quindi ha una copertura effettiva inferiore rispetto alla copertura pubblicizzata.

Se due intervalli di confidenza sono entrambi molto precisi o uno è esatto e l'altro molto accurato confrontando l'ampiezza attesa potrebbe essere a posto perché almeno ora stiamo esaminando solo due due varietà di mele.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.