Interpretazione dell'intervallo di confidenza


16

Nota: mi scuso in anticipo se questo è un duplicato, non ho trovato una q simile nella mia ricerca

Supponiamo di avere un parametro vero p. Un intervallo di confidenza C (X) è un camper che contiene p, diciamo il 95% delle volte. Supponiamo ora di osservare X e calcolare C (X). La risposta comune sembra essere che non è corretto interpretare questo come se avesse una "probabilità del 95% di contenere p" poiché "o fa o non contiene p"

Tuttavia, diciamo che scelgo una carta dalla cima di un mazzo mescolato e la lascio coperta. Intuitivamente penso alla probabilità che questa carta sia l'asso di picche come 1/52, anche se in realtà "o è o non è l'asso di picche". Perché non posso applicare questo ragionamento all'esempio dell'intervallo di confidenza?

Oppure, se non è significativo parlare della "probabilità" che la carta sia l'asso di picche poiché "è o non è", continuerei a stabilire 51: 1 probabilità che non sia l'asso di picche. C'è un'altra parola per descrivere queste informazioni? In che modo questo concetto è diverso dalla "probabilità"?

modifica: forse per essere più chiari, da un'interpretazione bayesiana della probabilità, se mi viene detto che una variabile casuale contiene p 95% del tempo, data la realizzazione di quella variabile casuale (e nessuna altra informazione su cui condizionare) è vero? corretto dire che la variabile casuale ha una probabilità del 95% di contenere p?

modifica: inoltre, da una interpretazione frequente della probabilità, diciamo che il frequentista accetta di non dire niente del tipo "esiste una probabilità del 95% che l'intervallo di confidenza contenga p". È ancora logico che un frequentatore abbia una "confidenza" che l'intervallo di confidenza contiene p?

Sia alfa il livello di significatività e sia t = 100-alfa. K (t) è la "confidenza" del frequentatore che l'intervallo di confidenza contiene p. Ha senso che K (t) dovrebbe aumentare in t. Quando t = 100%, il frequentista dovrebbe avere la certezza (per definizione) che l'intervallo di confidenza contiene p, quindi possiamo normalizzare K (1) = 1. Allo stesso modo, K (0) = 0. Presumibilmente K (0,95) è da qualche parte tra 0 e 1 e K (0.999999) è maggiore. In che modo il frequentista considererebbe K diverso da P (la distribuzione di probabilità)?


1
In effetti, consideriamo un lancio della moneta in cui la moneta rotola sotto un tavolo, fuori dalla vista e consideriamo l'evento in cui la moneta è caduta sulle teste. A prima vista questo sembra essere molto simile al problema dell'IC - chiaramente o l'evento è accaduto o no. Tuttavia, nel caso del lancio della moneta molti frequentatori (forse anche la maggior parte) sembrano perfettamente felici di assegnare una probabilità nozionale, (diciamo ) alla moneta non osservata che è finita in testa, mentre si allontanano dal dire la stessa cosa sull'intervallo casuale contenente il parametro. A me sembra esserci un'incoerenza. p
Glen_b -Restastate Monica il

@Glen_b I frequentatori dello scenario con gettoniera non osservata applicano il ragionamento controfattuale per dire, non che il valore nominale effettivo della moneta è "casuale" (sebbene non sia osservato), ma che possiamo generalizzare qualsiasi risultato osservato ad altri potenziali risultati in questo calo conia e calcola le probabilità. Per quanto riguarda la probabilità del valore nominale effettivo della moneta, è o non è testa, non c'è probabilità. La viene salvata per la costruzione controfattuale di questa impostazione. p
AdamO,

@Glen_b: sono d'accordo, vedi la mia domanda qui: stats.stackexchange.com/questions/233588/…
vonjd

@vonjd fino a che punto la tua domanda non esiste semplicemente un duplicato del primo paragrafo dopo l'apertura "Nota:" qui?
Glen_b -Restate Monica

@Glen_b: A dire il vero non ero a conoscenza di questa domanda quando ho pubblicato la mia e sicuramente si sovrappongono. Eppure penso che non siano duplicati perché il mio è più generalmente interessato all'utilizzo delle probabilità per risultati nascosti (che avrebbero conseguenze per gli intervalli di confidenza) mentre questo mira esclusivamente a intervalli di confidenza. Ma se pensi che il mio sia un duplicato, sentiti libero di chiuderlo.
vonjd,

Risposte:


8

Penso che molti resoconti convenzionali su questo argomento non siano chiari.

Diciamo che prendi un campione di dimensioni e ottieni un intervallo di confidenza del 95 % per p .10095%p

Quindi prendi un altro campione di , indipendentemente dal primo, e ottieni un altro intervallo di confidenza del 95 % per p .10095%p

Ciò che cambia è l'intervallo di confidenza; ciò che non cambia è . p Ciò significa che nei metodi frequentisti si dice che l'intervallo di confidenza è "casuale" ma è "fisso" o "costante", cioè non casuale. Nei metodi frequentisti, come il metodo degli intervalli di confidenza, si assegnano le probabilità solo a cose casuali.p

( L , U ) L = U = L U pPr(L<p<U)=0.95(L,U)L=U=LUp

Diciamo in un caso particolare che hai e . Nei metodi frequentisti non si assegnerebbe una probabilità all'istruzione , a parte una probabilità di o , perché qui nulla è casuale: non è casuale, non è casuale (poiché non cambierà se prendiamo un nuovo campione) e non è casuale.U = 43,61 40,53 < p < 43,61L=40.53U=43.6140.53<p<43.610140.53p43.61

In pratica, le persone si comportano come se fossero al sicuri che sia compreso tra e . E in pratica, ciò può avere spesso senso. Ma a volte no. Uno di questi casi è se i numeri grandi fino a o più sono noti in anticipo per essere improbabili o se sono noti per essere altamente probabili. Se uno può assegnare una distribuzione di probabilità precedente a , usa il teorema di Bayes per ottenere un intervallo credibile, che può differire dall'intervallo di confidenza a causa della conoscenza precedente di quali intervalli di valori di95%p40.5343.6140ppsono probabili o improbabili. In realtà può anche accadere che i dati stessi --- le cose che cambiano se viene preso un nuovo campione, possano dirti che è improbabile che sia, o addirittura che non lo sia, grande quanto . Ciò può accadere anche nei casi in cui la coppia è una statistica sufficiente per . Tale fenomeno può essere affrontato in alcuni casi con il metodo di Fisher di condizionare una statistica accessoria. Un esempio di quest'ultimo fenomeno è quando il campione è costituito solo da due osservazioni indipendenti che sono distribuite uniformemente nell'intervallo . Quindi l'intervallo dalla più piccola delle due osservazioni alla più grande è unp40(L,U)pθ±1/250%intervallo di confidenza. Ma se la distanza tra loro è , sarebbe assurdo essere vicino al sicuro che sia tra loro, e se la distanza sia , uno sarebbe ragionevolmente quasi il sicuro è tra di loro. La distanza tra loro sarebbe la statistica accessoria su cui si dovrebbe condizionare.0.00150%θ0.999100%θ


Grazie Michael, ha molto senso. Supponiamo che nel tuo esempio abbiamo un particolare (L, U) ma i valori non ci sono noti. Tutto quello che sappiamo è che si tratta della realizzazione di una variabile casuale dell'intervallo di confidenza al 95%. Senza alcun precedente sul parametro o qualsiasi altra informazione, sarebbe corretto porre le probabilità 19: 1 che (L, U) contenga il parametro? Se un frequentatore è disposto a farlo, ma non chiama la sua "volontà di porre la probabilità 19: 1 che contiene il parametro" una "probabilità", come lo chiameremmo?
applicative_x

Sì, quella probabilità è . Certamente nei metodi frequentisti si può dire che in uno stato di ignoranza di la probabilità è che quell'intervallo contenga . Ma quando si hanno valori particolari, che non sono casuali, il frequentista non assegnerà una probabilità diversa da o all'istruzione, poiché i valori noti di e non sono casuali. 0.95(L,U)0.95p01LU
Michael Hardy,

3

La definizione del libro di testo di un intervallo di confidenza % è:100×(1α)

Un intervallo che, in molte repliche indipendenti dello studio in condizioni ideali, acquisisce la misurazione dell'effetto replicato % delle volte.100×(1α)

La probabilità, per i frequentatori, deriva dall'idea di "riavvolgere il tempo e lo spazio" per replicare i risultati, come se un numero infinito di copie del mondo fosse creato per valutare un risultato scientifico ancora e ancora e ancora. Quindi una probabilità è esattamente una frequenza. Per gli scienziati, questo è un modo molto conveniente per discutere i risultati, poiché il primo principio della scienza è che gli studi devono essere replicabili.

Nell'esempio della tua carta, la confusione per Bayesiani e Frequentisti è che il frequentista non assegna una probabilità al valore nominale della particolare carta che hai lanciato dal mazzo mentre un Bayesiano lo farebbe. Il frequentista assegnerebbe la probabilità a una carta, lanciata dalla cima del mazzo mescolato casualmente. Un bayesiano non si preoccupa di replicare lo studio, una volta che la carta viene lanciata, ora hai il 100% di convinzione su cosa sia la carta e lo 0% che possa assumere qualsiasi altro valore. Per i bayesiani, la probabilità è una misura di credenza.

Si noti che i bayesiani non hanno intervalli di confidenza per questo motivo, riassumono l'incertezza con intervalli di credibilità .


Grazie per la risposta. Nell'esempio della carta, sia il bayesiano che il frequentista non sarebbero d'accordo sul fatto che 51: 1 abbia buone probabilità che la carta sia l'asso di picche? Allo stesso modo, per la realizzazione di un intervallo di confidenza al 95% (e nessun'altra informazione), entrambi non avrebbero probabilità 19: 1 che contenga il parametro vero? In tal senso, un bayesiano potrebbe interpretare l'intervallo di confidenza al 95% come una probabilità del 95% di contenere il parametro vero?
applicative_x

@applicative_x Che ne dici di un mazzo di pinochle? Stai valutando l'uso di informazioni precedenti. La frequentista può solo ipotizzare che la probabilità è e utilizzare solo il volto della carta valueto informare se questo esperimento è stato coerente o non coerenti con questa ipotesi. La validità di qualsiasi tipo di stima dell'intervallo (credibilità o fiducia) dipende da ipotesi non verificabili. Non esiste un vero parametro, questo è un modo pericoloso di pensare alla scienza. I bayesiani non giocano con intervalli di confidenza secondo la definizione precedente. Rileggi la risposta. p=1/52
AdamO,

Grazie Adam, penso di essere ancora confuso. Supponiamo che io sappia (guardando le carte) che un mazzo di 52 carte è standard. Mescolo il mazzo e scelgo le prime 10 carte senza guardarle. Non potrei definire il "parametro vero" in questo caso per essere il numero di cartellini rossi? Quindi, indipendentemente dal bayesiano e dal frequentista, esiste un "parametro vero". Se mi è permesso di scegliere 7 carte a caso, potrei anche immaginare di costruire un intervallo di confidenza per il numero di cartellini rossi tra i miei 10.
applicative_x

1
Un bayesiano non deve credere che non esista un valore reale di un parametro. Bayesianismo significa semplicemente assegnare probabilità a dichiarazioni incerte, indipendentemente dal fatto che siano casuali. Un Bayesiano può assegnare probabilità per la dichiarazione che ci fosse vita su Marte un miliardo di anni fa. Un frequentatore non può farlo, dal momento che non si può dire che ciò sia accaduto nella metà di tutti i casi. Nulla di ciò afferma che un bayesiano non possa credere che esista una vera risposta alla domanda se su Marte esistesse una simile vita. Vedi anche la mia risposta postata alla tua domanda. 1/2
Michael Hardy,

1
@AdamO: trovo i tuoi commenti criptici. 'di quale utilità sia la nozione di "verità"' è un cambiamento di argomento. "Pensiamo alla verità come immutabile." Quindi "noi" significa te e chi altro, e qual è la rilevanza di ciò che pensano? "Nessuno scienziato farebbe mai la raccolta di dati per verificare qualcosa che è già noto." Sembra un altro cambio di argomento. Quindi seguono alcuni commenti su frequentatori e bayesiani. Non ho voglia di indovinare cosa stai cercando di dire.
Michael Hardy,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.