Cos'è esattamente un intervallo di confidenza?


86

So approssimativamente e in modo informale cos'è un intervallo di confidenza. Tuttavia, non riesco a avvolgere la testa attorno a un dettaglio piuttosto importante: Secondo Wikipedia:

Un intervallo di confidenza non prevede che il vero valore del parametro abbia una particolare probabilità di trovarsi nell'intervallo di confidenza dati i dati effettivamente ottenuti.

Ho anche visto punti simili fatti in diversi punti di questo sito. Una definizione più corretta, anche da Wikipedia, è:

se gli intervalli di confidenza sono costruiti attraverso molte analisi dei dati separate di esperimenti ripetuti (e possibilmente diversi), la proporzione di tali intervalli che contengono il valore reale del parametro corrisponderà approssimativamente al livello di confidenza

Ancora una volta, ho visto punti simili fatti in diversi punti di questo sito. Non capisco Se, in esperimenti ripetuti, la frazione degli intervalli di confidenza calcolati che contengono il vero parametro è , allora come può la probabilità che sia nell'intervallo di confidenza calcolata per l'esperimento effettivo essere diversa da ? Sto cercando quanto segue in una risposta:( 1 - α ) θ ( 1 - α )θ(1α)θ(1α)

  1. Chiarimento della distinzione tra le definizioni errate e corrette sopra.

  2. Una definizione formale e precisa di un intervallo di confidenza che mostra chiaramente perché la prima definizione è errata.

  3. Un esempio concreto di un caso in cui la prima definizione è incredibilmente sbagliata, anche se il modello sottostante è corretto.


4
Questo post presenta alcune buone discussioni sulla questione degli intervalli di confidenza stats.stackexchange.com/questions/2356/… . L'articolo a cui si fa riferimento nel post, credo, aiuta a chiarire con precisione il motivo per cui le definizioni di cui sopra sono corrette per gli intervalli di confidenza. È spesso quando si guarda come si scompongono gli EC che si è in grado di capirli meglio.
Probislogic,

2
Una parte di me applaude alla domanda (+1). Una parte in competizione vuole sottolineare che 1. La stragrande maggioranza dei consumatori di statistiche, persone che usano le statistiche in modo pragmatico ma non filosofico al fine di sostenere la chimica o le ricerche di mercato, non afferreranno mai le bellezze dei problemi e spesso essere in perdita per spiegare i risultati. 2. Anche alcuni statistici puristi possono cadere nella trappola di fare affermazioni presumibilmente probabilistiche come quelle che coinvolgono intervalli di confidenza quando non lavorano con campioni casuali. Un problema molto più grande.
rolando2,

3
@Mario Il tuo presupposto non è vero! Su 100 ripetizioni dell'esperimento, prevediamo che 95 dei CI (non i mezzi) contengano la media vera (ma sconosciuta). L'IC è casuale ma la media della popolazione reale non lo è.
whuber

6
C'è un bel documento di Cumming & Maillardet (2006) che mostra che non il 95% dei mezzi di replica cadrà nell'IC originale, ma solo l'83,4% (chiamano questo valore "percentuale di acquisizione"). Il motivo è che ci sono due fonti di variabilità: A) la variabilità della media originale intorno mue, B) la variabilità della replica si aggira intorno mu. Molte persone dimenticano A: l'IC originale non è necessariamente costruito intorno mu!
Felix S,

Risposte:


26

Ho trovato utile questo esperimento mentale quando ho pensato agli intervalli di confidenza. Risponde anche alla tua domanda 3.

Sia e . Considera due osservazioni di prendono i valori e corrispondenti alle osservazioni e di e lascia che e . Quindi è un intervallo di confidenza del 50% per (poiché l'intervallo include if o , ognuno dei quali ha probabilità ).Y = X + a - 1XU(0,1)Y=X+a12Yy1y2x1x2Xy u = max ( y 1 , y 2 ) [ y l , y u ] a a x 1 < 1yl=min(y1,y2)yu=max(y1,y2)[yl,yu]aax1>1x1<12<x21x1>12>x214

Tuttavia, se allora sappiamo che la probabilità che l'intervallo contenga è , non . La sottigliezza è che un intervallo di confidenza per un parametro significa che gli endpoint dell'intervallo (che sono variabili casuali) giacciono su entrambi i lati del parametro con probabilità prima di calcolare l'intervallo , non che la probabilità del parametro che giace all'interno dell'intervallo è dopo aver calcolato l'intervallo . a11yuyl>12a1 z%z%z%12z%z% z%


3
Si noti che quasi sicuramente, quindi l'intervallo contiene il parametro con probabilità zero. In effetti il ​​tuo argomento funziona se quello che stai stimando è . [ y l , y u ] a θ = a + 1Y>a[yl,yu]aθ=a+12
Forse

4
Non penso che questo contro esempio sia valido, perché conosci solo la probabilità che l'intervallo contenga è uno dopo aver visto che . È perfettamente ragionevole che la probabilità cambi dopo che acquisiamo ulteriori informazioni. Se tutto ciò che sapevi era che l'intervallo era un intervallo di confidenza del 50%, allora la probabilità sarebbe ancora 1/2 (anche se sarebbe una probabilità bayesiana non frequentista in quanto si applica a un evento particolare che non ha una frequenza a lungo termine)y u - y l > 1 / 2θyuyl>1/2
Dikran Marsupial,

1
Questo è davvero un buon esempio, ma non sono assolutamente d'accordo con le tue affermazioni sulle probabilità che cambiano in qualche modo prima e dopo il calcolo dell'intervallo di confidenza. Non ha senso e dà l'impressione che la matematica si preoccupi in qualche modo di ciò che sai e di ciò che non conosci. Non !! Hai sempre che è . Hai sempre anche che è . Questa non è una contraddizione, una è semplicemente una probabilità incondizionata e l'altra è una probabilità condizionata. 1P(a[yl,yu]) P(a[yl,yu]121P(a[yl,yu]|yuyl>12)1
fgp

2
@fgp, sì, forse è una scarsa espressione da parte di Taylor che parla del cambiamento delle probabilità. Nessuna probabilità sta cambiando. Ciò che l'argomento sta mostrando è come sia facile che sorgano situazioni che dimostrano che la comprensione errata degli EC porta a problemi logici. Se ritieni che un elemento della configurazione che osservi abbia una probabilità del 50% di essere corretta ma non può essere corretta, allora stai capendo che una CI è sbagliata.
Giovanni

36

Esistono molte questioni relative agli intervalli di confidenza, ma concentriamoci sulle citazioni. Il problema sta nelle possibili interpretazioni errate piuttosto che nella questione della correttezza. Quando le persone dicono che un "parametro ha una particolare probabilità di" qualcosa, pensano che il parametro sia una variabile casuale. Questo non è il punto di vista di una procedura (classica) dell'intervallo di confidenza, per cui la variabile casuale è l'intervallo stesso e il parametro è determinato, non casuale, ma sconosciuto. Questo è il motivo per cui tali affermazioni vengono frequentemente attaccate.

Matematicamente, se lasciamo essere qualsiasi procedura che associa i dati per sottoinsiemi dello spazio dei parametri e se (non importa quale sia il valore del parametro può essere) l'affermazione definisce un evento , quindi - per definizione - ha una probabilità per ogni possibile valore di . Quando è una procedura con intervallo di confidenza con fiducia si presume che questa probabilità abbia un infimo (su tutti i valori dei parametri) dix = ( x i ) θ θ t ( x ) A ( x ) Pr θ ( A ( x ) ) θ t 1 - α 1 - αtx=(xi)θθt(x)A(x)Prθ(A(x))θt1α1α. (In base a questo criterio, di solito selezioniamo procedure che ottimizzano alcune proprietà aggiuntive, come la produzione di brevi intervalli di confidenza o simmetrici, ma questa è una questione separata.) La Legge debole dei grandi numeri giustifica quindi la seconda citazione. Questa, tuttavia, non è una definizione di intervalli di confidenza: è semplicemente una proprietà che hanno.

Penso che questa analisi abbia risposto alla domanda 1, dimostri che la premessa della domanda 2 è errata e rende discutibile la domanda 3.


3
Grazie per aver fornito una risposta a una domanda eccellente. Posso far apparire la seguente analogia per ulteriori discussioni? Supponiamo di lanciare più volte una moneta giusta. Quindi, . Ora lancio una volta la moneta, ma non ti faccio vedere quello che ho lanciato e chiedo: "Qual è la probabilità che le teste aumentino?". Come risponderesti a questa domanda? P(Head)=.50
Wolfgang,

3
Un altro modo di esprimerlo: per i non bayesiani, le uniche "cose" che possono avere una probabilità sono possibili eventi - nel senso dei risultati futuri di un esperimento casuale. Dato che il parametro ha un valore vero fisso, una volta che hai un intervallo con valori specifici, non è più un possibile evento se il parametro è incluso o meno nell'intervallo. Di conseguenza, puoi avere fiducia nel processo che genera l'intervallo, ma non in due numeri specifici.
Caracal,

1
@caracal - solo un po 'di spunti di riflessione, un "lancio di monete" è davvero "casuale"? Se dici "sì", respingi l'idea che se una moneta esce testa è una funzione deterministica (ma complicata) di molte cose (diciamo: vento, altitudine, forza e angolo di lancio, peso della moneta, ecc. Ecc.) .). Penso che ciò mostri il doppio standard di "casualità" che si applica al pensiero basato su CI. I dati sono fissi ma non siamo sicuri del suo valore (i dati ergo sono casuali ), mentre i parametri sono fissi ma non siamo sicuri del suo valore ( i parametri ergo non sono casuali ).
Probislogic,

4
@ Wolfgang Non vedo come il tuo esempio riguardi gli intervalli di confidenza. Non si richiede nulla relativo a un parametro distributivo. La tua situazione è strettamente correlata agli intervalli di previsione. Penso che tutta questa discussione possa avere un certo interesse in quel contesto, ma non appartiene a un filo sugli intervalli di confidenza.
whuber

2
@whuber La domanda se si può fare una dichiarazione di probabilità su un particolare IC al 95% catturando il vero parametro sconosciuto è molto simile alla domanda se si può fare una dichiarazione di probabilità su un capovolgimento specifico in cui il risultato è ancora sconosciuto. A lungo termine, il 95% degli EC acquisirà il parametro. A lungo termine, il 50% delle lancette sono teste. Possiamo dire che esiste una probabilità del 95% che un determinato elemento della configurazione acquisisca il parametro? Possiamo dire che esiste una probabilità del 50% che le teste siano alzate prima di guardare? Direi di sì ad entrambi. Ma alcune persone potrebbero non essere d'accordo.
Wolfgang,

19

Non definirei errata la definizione di EC, ma sono facili da interpretare erroneamente, poiché esiste più di una definizione di probabilità. Gli IC si basano sulla seguente definizione di Probabilità (Frequentista o ontologica)

(1) probabilità di una proposizione = percentuale di lungo periodo di volte in cui la proposizione è considerata vera, in base al processo di generazione dei dati

Pertanto, per essere concettualmente validi nell'uso di un elemento della configurazione, è necessario accettare questa definizione di probabilità. In caso contrario, l'intervallo non è un elemento della configurazione, dal punto di vista teorico.

Questo è il motivo per cui la definizione ha usato la parola proporzione e NON la parola probabilità , per chiarire che viene utilizzata la definizione di "frequenza a lungo termine" della probabilità.

La principale definizione alternativa di Probabilità (epistemologica o probabilità come estensione della logica deduttiva o bayesiana) è

(2) probabilità di una proposizione = grado razionale di convinzione che la proposizione sia vera, subordinata a uno stato di conoscenza

Le persone spesso confondono in modo intuitivo entrambe queste definizioni e usano qualsiasi interpretazione accada per intuizione. Questo può portarti in ogni tipo di situazione confusa (specialmente quando passi da un paradigma all'altro).

Che i due approcci spesso portino allo stesso risultato, significa che in alcuni casi abbiamo:

razionale grado di convinzione che la proposizione sia vera, subordinata a uno stato di conoscenza = proporzione di lungo periodo di volte in cui la proposizione è considerata vera, subordinata al processo di generazione dei dati

Il punto è che non vale universalmente , quindi non possiamo aspettarci che le due diverse definizioni conducano sempre agli stessi risultati. Pertanto, a meno che non si risolva effettivamente la soluzione bayesiana e quindi si ritenga che sia lo stesso intervallo, non è possibile fornire all'intervallo dato dall'IC l'interpretazione come una probabilità di contenere il valore reale. E se lo fai, allora l'intervallo non è un intervallo di confidenza, ma un intervallo credibile.


2
Non vedo perché la probabilità di una proposizione secondo la definizione 1 dovrebbe essere un numero razionale. La proporzione a lungo termine sembra riferirsi al limite delle proporzioni dei tempi in modo tale che la proposizione sia osservata come vera. Ogni proporzione è un numero razionale ma il loro limite potrebbe non esserlo. (Fortunatamente, questa tua parentesi sembra al massimo tangenziale per il resto della tua risposta.)
Ha fatto il

3
@probability Questa risposta sembra portarci via in modo tangente in un modo non molto costruttivo. L'equazione di probabilità e proporzione è una forma di confusione ontologica, simile all'equazione di una temperatura con il livello di mercurio in un termometro: uno è un costrutto teorico e l'altro è un fenomeno fisico usato per misurarlo. C'è qualche discussione al riguardo su stats.stackexchange.com/questions/1525/… .
whuber

@Didier: hai ragione, in effetti la sequenza di , che è termini razionali con limite irrazionale. Ho rimosso questa osservazione. Grazie per averlo sollevato. xn=r2xn1+xn12r
Probislogic,

6
@whuber - Il punto è rilevante da sollevare perché è proprio questo fraintendimento che porta le persone a interpretare gli IC nel modo sbagliato. La confusione delle probabilità con il "grado razionale di credenza" non è coerente con il paradigma frequentista. Questo è ciò che accade quando si prendono gli IC per indicare "probabilità che il valore reale sia nell'intervallo", che è ciò che sta facendo @dsimcha nella domanda.
Probislogic,

1
@probability Grazie per la spiegazione. Avevo capito che la tua risposta era in accordo con una definizione di "probabilità = proporzione". In effetti, una rilettura ravvicinata suggerisce ancora questo è ciò che stai dicendo nel terzo paragrafo, anche se il tuo commento ora lo caratterizza come un malinteso. Potresti voler chiarire questo punto.
whuber

6

RA Fisher aveva un criterio per l'utilità degli intervalli di confidenza: un CI non dovrebbe ammettere di "sottoinsiemi identificabili" che implicano un diverso livello di confidenza. Nella maggior parte (se non in tutti) dei controesempi, abbiamo casi in cui vi sono sottoinsiemi identificabili con diverse probabilità di copertura.

In questi casi, è possibile utilizzare gli intervalli di credenza bayesiani per specificare un senso soggettivo di dove si trova il parametro, oppure è possibile formulare un intervallo di probabilità per riflettere l'incertezza relativa nel parametro, dati i dati.

Ad esempio, un caso che sembra relativamente privo di contraddizioni è l'intervallo di confidenza normale su due lati per la media della popolazione. Supponendo che il campionamento da una popolazione normale con data standard, l'IC 95% non ammetta sottoinsiemi identificabili che fornirebbero maggiori informazioni sul parametro. Ciò può essere visto dal fatto che la media del campione è una statistica sufficiente nella funzione di verosimiglianza - cioè, la funzione di verosimiglianza è indipendente dai singoli valori del campione una volta che conosciamo la media del campione.

Il motivo per cui abbiamo una fiducia soggettiva nell'IC simmetrica al 95% per la media normale deriva meno dalla probabilità di copertura dichiarata e più dal fatto che l'IC simmetrica al 95% per la media normale è l'intervallo di "massima probabilità", vale a dire tutto i valori dei parametri all'interno dell'intervallo hanno una probabilità maggiore di qualsiasi valore di parametro al di fuori dell'intervallo. Tuttavia, poiché la probabilità non è una probabilità (nel senso della precisione a lungo termine), è più un criterio soggettivo (come l'uso bayesiano del precedente e della probabilità). Insomma, ci sono infiniti intervalli per la media normale che hanno una probabilità di copertura del 95%, ma solo la CI simmetrica ha la plausibilità intuitiva che ci aspettiamo da una stima dell'intervallo.

Pertanto, il criterio di RA Fisher implica che la probabilità di copertura dovrebbe essere equiparata alla fiducia soggettiva solo se non ammette nessuno di questi sottoinsiemi identificabili. Se sono presenti sottoinsiemi, la probabilità di copertura sarà subordinata ai valori reali dei parametri che descrivono il sottoinsieme. Per ottenere un intervallo con il livello intuitivo di confidenza, è necessario condizionare la stima dell'intervallo sulle statistiche accessorie appropriate che aiutano a identificare il sottoinsieme. OPPURE, potresti ricorrere a modelli di dispersione / miscela, il che porta naturalmente a interpretare i parametri come variabili casuali (ovvero le statistiche bayesiane) oppure puoi calcolare il profilo / le probabilità condizionali / marginali nel quadro della probabilità. Ad ogni modo, hai abbandonato ogni speranza di trovare una probabilità oggettivamente verificabile di essere corretta,

Spero che sia di aiuto.


1
(+1) Un modo per giustificare la CI normale simmetrica è che riduce al minimo la lunghezza prevista. In definitiva, ciò spinge semplicemente indietro la soggettività alla scelta della lunghezza come funzione di perdita in una procedura decisionale: ma questo è probabilmente un "buon" tipo di soggettività (perché espone il ruolo dei nostri obiettivi analitici nella nostra scelta della procedura statistica) piuttosto che soggettività "cattiva", che suona semplicemente come un epiteto peggiorativo.
whuber

5

Da un punto di vista teorico, le domande 2 e 3 si basano sul presupposto errato che le definizioni siano errate. Pertanto, sono d'accordo con la risposta di @ whuber al riguardo e la risposta di @ whuber alla domanda 1 non richiede alcun input aggiuntivo da parte mia.

Tuttavia, da una prospettiva più pratica, a un intervallo di confidenza può essere data la sua definizione intuitiva (Probabilità di contenere il valore reale) quando è numericamente identica a un intervallo credibile bayesiano basato sulle stesse informazioni (cioè un precedente non informativo).

Ma questo è in qualche modo scoraggiante per il duro anti-bayesiano, perché per verificare le condizioni per dare alla sua CI l'interpretazione che vuole dare, devono elaborare la soluzione bayesiana, per la quale l'interpretazione intuitiva vale automaticamente!

L'esempio più semplice è un intervallo di confidenza per la media normale con una varianza nota e un intervallo credibile posteriore .¯ x ± σ Z α / 2 1 - α ¯ x ± σ Z α / 21αx¯±σZα/21αx¯±σZα/2

Non sono esattamente sicuro delle condizioni, ma so che sono importanti per l'interpretazione intuitiva degli EC:

1) esiste una statistica Pivot, la cui distribuzione è indipendente dai parametri (esistono pivot esatti al di fuori delle distribuzioni normali e chi-quadrato?)

2) non ci sono parametri di disturbo, (tranne nel caso di una statistica Pivotal, che è uno dei pochi modi esatti in cui si devono gestire i parametri di disturbo durante la creazione di EC)

3) esiste una statistica sufficiente per il parametro di interesse e l'intervallo di confidenza utilizza la statistica sufficiente

4) la distribuzione campionaria della statistica sufficiente e la distribuzione posteriore presentano una sorta di simmetria tra la statistica sufficiente e il parametro. Nel caso normale la distribuzione campionaria la simmetria è in mentre .(μ|¯x,σ)N(¯x,σ(x¯|μ,σ)N(μ,σn)(μ|x¯,σ)N(x¯,σn)

Queste condizioni sono generalmente difficili da trovare, e di solito è più veloce calcolare l'intervallo bayesiano e confrontarlo. Un esercizio interessante potrebbe anche essere quello di provare a rispondere alla domanda "per quale precedente il mio CI è anche un intervallo credibile?" Puoi scoprire alcune ipotesi nascoste sulla tua procedura di CI guardando questo precedente.


1
(+1) Esiste davvero una persona come un "anti-bayesiano"? :-)
whuber

6
@whuber Eccone uno . Ed ecco un econometrico che collabora con lei alla borsa di studio in filosofia della statistica.
Ciano

1
Grazie! Questo è un filo estremamente interessante nella filosofia della probabilità e delle statistiche di cui non ero a conoscenza.
whuber

1
Hai sbagliato a scrivere come mancante ? x¯±zα/2σnn
qazwsx,

3

Questa è una cosa che può essere difficile da capire:

  • se in media il 95% di tutti gli intervalli di confidenza conterrà il parametro
  • e ho un intervallo di confidenza specifico
  • perché la probabilità che questo intervallo contenga il parametro non è anche del 95%?

Un intervallo di confidenza si riferisce alla procedura di campionamento. Se prendessi molti campioni e calcolassi un intervallo di confidenza del 95% per ciascun campione, scopriresti che il 95% di tali intervalli contiene la media della popolazione.

Ciò è utile, ad esempio, per i dipartimenti di qualità industriale. Quei ragazzi prendono molti campioni e ora hanno la certezza che la maggior parte delle loro stime sarà abbastanza vicina alla realtà. Sanno che il 95% delle loro stime è abbastanza buono, ma non possono dirlo su ogni singola stima specifica.

Confronta questo con il lancio di dadi: se lanciassi 600 dadi (equi), quanti 6 lanceresti? La tua ipotesi migliore è * 600 = 100.16

Tuttavia, se hai lanciato UN dado, è inutile dire: "C'è una probabilità dell'1 / 6 o 16,6% che ora ho lanciato un 6". Perché? Perché il dado mostra un 6 o qualche altra figura. Hai lanciato un 6 o no. Quindi la probabilità è 1 o 0. La probabilità non può essere .16

Alla domanda prima del tiro quale sarebbe la probabilità di lanciare un 6 con UN dado, un bayesiano risponderebbe " " (in base a informazioni precedenti: tutti sanno che un dado ha 6 facce e pari probabilità di ricadere su uno di essi), ma un Frequentista direbbe "Nessuna idea" perché il frequentismo si basa esclusivamente sui dati, non su priori o informazioni esterne.16

Allo stesso modo, se hai solo 1 campione (quindi 1 intervallo di confidenza), non hai modo di dire quanto è probabile che la media della popolazione sia in quell'intervallo. La media (o qualsiasi parametro) è o in essa o no. La probabilità è 1 o 0.

Inoltre, non è corretto che i valori nell'intervallo di confidenza siano più probabili di quelli esterni. Ho fatto una piccola illustrazione; tutto è misurato in ° C. Ricorda, l'acqua si congela a 0 ° C e bolle a 100 ° C.

Il caso: in un lago freddo, vorremmo stimare la temperatura dell'acqua che scorre sotto il ghiaccio. Misuriamo la temperatura in 100 posizioni. Ecco i miei dati:

  • 0,1 ° C (misurato in 49 posizioni);
  • 0,2 ° C (anche in 49 posizioni);
  • 0 ° C (in 1 posizione. Era acqua che stava per congelare);
  • 95 ° C (in una posizione, c'è una fabbrica che scarica illegalmente acqua molto calda nel lago).
  • Temperatura media: 1,1 ° C;
  • Deviazione standard: 1,5 ° C;
  • 95% -CI: (-0,8 ° C ...... + 3,0 ° C).

Le temperature all'interno di questo intervallo di confidenza NON sono sicuramente più probabili di quelle esterne. La temperatura media dell'acqua che scorre in questo lago NON PU be essere più fredda di 0 ° C, altrimenti non sarebbe acqua ma ghiaccio. Una parte di questo intervallo di confidenza (ovvero la sezione da -0,8 a 0) ha in realtà una probabilità dello 0% di contenere il parametro vero.

In conclusione: gli intervalli di confidenza sono un concetto frequentista e quindi si basano sull'idea di campioni ripetuti. Se molti ricercatori prenderebbero campioni da questo lago e se tutti quei ricercatori calcolassero gli intervalli di confidenza, allora il 95% di tali intervalli conterrà il parametro vero. Ma per un singolo intervallo di confidenza è impossibile dire quanto sia probabile che contenga il parametro vero.


1
Non confondere il fatto che la statistica del frequentista non misura la convinzione con una persona frequentista che ha precedenti convinzioni e le aggiorna. La differenza non è se il frequentista sia un idiota senza conoscenza al di fuori dei dati, ma se le statistiche del frequentista forniscano misure dirette degli stati di convinzione. Il frequentista deve aggiornare le proprie convinzioni sulla base di test, EC, ecc. Altrimenti l'intero sistema non funziona perché tutto dipende dalle decisioni prese.
Giovanni

2

Ok, mi rendo conto che quando si calcola un intervallo di confidenza al 95% per un parametro usando i metodi frequentist classici, ciò non significa che esiste una probabilità del 95% che il parametro rientri in quell'intervallo. Eppure ... quando si affronta il problema da una prospettiva bayesiana e si calcola un intervallo credibile del 95% per il parametro, si ottiene (presupponendo un precedente non informativo) esattamente lo stesso intervallo che si ottiene utilizzando l'approccio classico. Quindi, se uso le statistiche classiche per calcolare l'intervallo di confidenza al 95% per (diciamo) la media di un set di dati, è vero che esiste una probabilità del 95% che il parametro si trovi in ​​quell'intervallo.


5
Se si ottiene lo stesso risultato utilizzando intervalli di confidenza frequentista e intervalli credibili bayesiani dipende dal problema, e in particolare dalla distribuzione precedente utilizzata nell'approccio bayesiano. È anche importante in matematica e scienze che quando hai ragione hai ragione per la ragione corretta!
Dikran Marsupial,

4
Se "usi le statistiche classiche per calcolare l'intervallo di confidenza al 95% per [un parametro]", allora, se stai ragionando in modo coerente, non ha senso fare riferimento a una "probabilità che il parametro si trovi in ​​quell'intervallo". Nel momento in cui menzioni quella probabilità, hai cambiato il tuo modello statistico della situazione. Nel nuovo modello, in cui il parametro è casuale, non è corretto calcolare un elemento della configurazione usando metodi frequentist. Ottenere la risposta giusta in questo modo in alcune situazioni è interessante ma non giustifica la confusione concettuale che sta alla base.
whuber

4
@whuber - la tua premessa "... se stai ragionando in modo coerente ..." ha una conseguenza dal buon vecchio teorema di Cox. Dice che se stai ragionando in modo coerente, allora la tua soluzione deve essere matematicamente equivalente a una bayesiana. Quindi, data questa premessa, un elemento della configurazione sarà necessariamente equivalente a un intervallo credibile e la sua interpretazione come probabilità è valida. E a Bayes, non è il parametro che ha una distribuzione, è l'incertezza su quel parametro che ha una distribuzione.
Probislogic,

2
... continua ... Quindi si può giocare al gioco stupido di Sono un bayesiano "Prob quel parametro è nell'intervallo", Sono un frequentista "Prob quell'intervallo copre il parametro", Sono un bayesiano ..., sono un frequentista, ..., sono un bayesiano ..., sono un frequentatore, ..... per tutto il tempo i numeri del calcolo effettivo non cambiano mai
probabilitlogic

2

Stai chiedendo informazioni sull'intervallo di confidenza del frequentista . La definizione (nota che nessuna delle 2 citazioni è una definizione! Solo affermazioni, che sono entrambe corrette) è:

Se avessi ripetuto questo esperimento un gran numero di volte, dato questo modello adattato con questi valori di parametro , nel 95% degli esperimenti il ​​valore stimato di un parametro rientrerebbe in questo intervallo.

Quindi hai un modello (costruito usando i tuoi dati osservati) e i suoi parametri stimati. Quindi, se si generano alcuni set di dati ipotetici in base a questo modello e parametri, i parametri stimati rientrerebbero nell'intervallo di confidenza.

Quindi, in realtà, questo approccio frequentista prende il modello e i parametri stimati come fissi, come indicato, e tratta i tuoi dati come incerti - come un campione casuale di molti altri possibili dati.

Questo è davvero difficile da interpretare e questo è spesso usato come argomento per le statistiche bayesiane ( che penso possa essere a volte poco discutibile . Le statistiche bayesiane d'altra parte prendono i tuoi dati come fissi e trattano i parametri come incerti. Gli intervalli credibili bayesiani sono quindi effettivamente intuitivo, come ci si aspetterebbe: gli intervalli credibili bayesiani sono intervalli in cui con il 95% si trova il valore del parametro reale.

Ma in pratica molte persone interpretano gli intervalli di confidenza del frequentatore allo stesso modo degli intervalli credibili bayesiani e molti statistici non lo considerano un grosso problema - sebbene tutti lo sappiano, non è corretto al 100%. Anche in pratica, gli intervalli di confidenza / credibilità bayesiani e frequentisti non differiranno molto, quando si usano priori disinformatori bayesiani .


-1 La tua "definizione" sembra essere errata, almeno in una lettura di essa. L' IC è costruito per coprire il vero parametro con probabilità . Non è subordinato a un modello o metodo particolare di adattamento dei parametri. Forse sto leggendo male la definizione, però: prendo "questo modello adattato con questo valore di parametro" per fare riferimento alla stima corrente del parametro. Se non è così che lo intendevi, forse potresti chiarire questo punto? 1α1α
whuber

@whuber, OK, lo prendo, ma se dici che il mio definiton è sbagliato, pubblica la tua definizione completa di cosa sia CI.
Curioso

Ho chiarito il mio commento, Tomas, perché mi viene in mente che potrei leggere la tua definizione in un modo che non volevi. Kiefer, Introduzione all'Inferenza statistica , scrive "[T] il risultato dell'esperimento è ... [S] sopra la procedura viene utilizzata per stimare e il valore reale di is ... [T] he quantità .. Il numero è chiamato coefficiente di confidenza della procedura che ... è chiamato aXt=[L,U]ϕ(θ)θθ0γt(θ0)=Prθ0{L(X)ϕ(θ0)U(X)}γ¯t=infθΩγt(θ)ttintervallo di confidenza. "
whuber

@whuber, la tua definizione è davvero incomprensibile per me e temo anche per la maggior parte delle persone :) E sì, intendevo la stima corrente, poiché il frequentatore ottiene la stima dei parametri come fornita e i dati come casuali, l'opposto di bayesiano.
Curioso

3
Penso che il problema principale nella tua definizione Curioso sia: "... il valore stimato di un parametro rientrerebbe nell'intervallo". Non è un parametro stimato ma un parametro fisso sconosciuto; e non rientra nell'intervallo, piuttosto l'intervallo si sposta e il 95% delle volte acquisisce il parametro.
Giovanni,

2

Supponiamo di trovarci in una situazione semplice. Hai un parametro sconosciuto e uno stimatore di che ha un'imprecisione intorno a 1 (informalmente). Pensi (informalmente) dovrebbe essere in più delle volte.θTθθ[T1;T+1]

In un vero esperimento osservi .T=12

È naturale porre la domanda "Dato ciò che vedo ( ), qual è la probabilità ?". Matematicamente: . Tutti naturalmente fanno questa domanda. La teoria dell'intervallo di confidenza dovrebbe logicamente rispondere a questa domanda. Ma non lo fa.T=12θ[11;13]P(θ[11;13]|T=12)

Le statistiche bayesiane rispondono a questa domanda. Nella statistica bayesiana, puoi davvero calcolare . Ma è necessario assumere una precedente che è una distribuzione per prima di fare l'esperimento e l'osservazione . Per esempio :P(θ[11;13]|T=12)θT

  • Supponiamo che abbia un'uniforme di distribuzione precedente suθ[0;30]
  • fai questo esperimento, trovaT=12
  • Applica la formula di Bayes:P(θ[11;13]|T=12)=0.94

Ma nelle statistiche frequenti, non esiste un precedente e quindi non esiste qualcosa come . Invece gli statistici dicono qualcosa del genere: "Qualunque sia , la probabilità che sia ". Matematicamente: "P(θ...|T...)θθ[T1;T+1]0.95θ,P(θ[T1;T+1]|θ)=0.95

Così :

  • Bayesiano: perT = 12P(θ[T1;T+1]|T)=0.94T=12
  • Frequentista:θ,P(θ[T1;T+1]|θ)=0.95

L'affermazione bayesiana è più naturale. Molto spesso, l'affermazione del frequentatore viene erroneamente interpretata spontaneamente come l'affermazione bayesiana (da qualsiasi normale cervello umano che non praticava statistiche da anni). E onestamente, molti libri statistici non chiariscono molto questo punto.

E praticamente?

In molte situazioni normali il fatto è che le probabilità ottenute dagli approcci frequentista e bayesiano sono molto vicine. Quindi confondere l'affermazione del frequentatore per quella bayesiana ha poche conseguenze. Ma "filosoficamente" è molto diverso.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.