Tutti i valori all'interno di un intervallo di confidenza del 95% sono ugualmente probabili?


56

Ho trovato informazioni discordanti sulla domanda: " Se si costruisce un intervallo di confidenza (CI) del 95% di una differenza nelle medie o una differenza nelle proporzioni, tutti i valori all'interno dell'IC sono ugualmente probabili? Oppure, la stima puntuale è la più probabile , con valori vicini alle "code" dell'IC meno probabili di quelli nel mezzo dell'IC?

Ad esempio, se un rapporto di sperimentazione clinica randomizzato afferma che il rischio relativo di mortalità con un particolare trattamento è 1,06 (IC 95% da 0,96 a 1,18), la probabilità che 0,96 sia il valore corretto equivale a 1,06?

Ho trovato molti riferimenti a questo concetto online, ma i seguenti due esempi riflettono l'incertezza in esso:

  1. Il modulo di Lisa Sullivan sugli intervalli di confidenza afferma:

    Gli intervalli di confidenza per la differenza nelle forniscono un intervallo di valori probabili per ( ). È importante notare che tutti i valori nell'intervallo di confidenza sono stime altrettanto probabili del valore reale di ( μ_1-μ_2 ).μ1μ2μ1μ2

  2. Questo post sul blog, intitolato Within the Margin of Error , afferma:

    Quello che ho in mente è l'incomprensione sul "margine di errore" che tratta tutti i punti all'interno dell'intervallo di confidenza con la stessa probabilità, come se il teorema del limite centrale implicasse una distribuzione uniforme limitata invece di una distribuzione t . [...]
    Ciò che manca di "margine di errore" è che le possibilità che si avvicinano alla stima puntuale sono molto più probabili delle possibilità che si trovano ai margini del margine ".

Sembrano contraddittorie, quindi qual è corretto?


7
Mi chiedo se ci sia confusione da qualche parte con il concetto correlato che i valori di p sono distribuiti uniformemente sotto l'ipotesi nulla ..
Michael McGowan,

4
La prima citazione è una distinta aberrante in un resoconto altrimenti accurato degli intervalli di confidenza. La seconda citazione proviene da un account che, per dirla bene, è un disastro: è pieno di affermazioni vaghe, errate o che possono essere interpretate solo in senso bayesiano. Ma entrambe le citazioni sono sbagliate !
whuber

@whuber Non definirei il secondo un casino ... Lo definirei un'interpretazione bayesiana dell'interpretazione frequentista :)
Michael McGowan,

1
@Michael Un esempio di trascuratezza è un solecismo come affermare che il CLT implica che "un numero infinito di stime ripetute della media [della popolazione] seguirà comunque una distribuzione normale". Non si deve sbagliare per comunicare idee semplicemente ad un pubblico non tecnico.
whuber

2
@whuber, considero la frase che citi solo un peccato minore. L'errore principale è che CLT non comporta la distribuzione t.
vetroso

Risposte:


23

Una domanda a cui è necessario rispondere è che cosa significa "probabile" in questo contesto?

Se significa probabilità (in quanto talvolta viene usato come sinonimo di) e stiamo usando rigorose definizioni di frequentatore, allora il valore del parametro vero è un singolo valore che non cambia, quindi la probabilità (probabilità) di quel punto è del 100% e tutto altri valori sono 0%. Quindi quasi tutti sono ugualmente probabili allo 0%, ma se l'intervallo contiene il valore vero, allora è diverso dagli altri.

Se utilizziamo un approccio bayesiano, l'IC (intervallo credibile) proviene dalla distribuzione posteriore e puoi confrontare la probabilità nei diversi punti all'interno dell'intervallo. A meno che il posteriore non sia perfettamente uniforme nell'intervallo (teoricamente possibile, immagino, ma sarebbe una strana circostanza), allora i valori hanno probabilità diverse.

Se usiamo la probabilità di essere simile alla fiducia, pensaci in questo modo: calcola un intervallo di confidenza al 95%, un intervallo di confidenza al 90% e un intervallo di confidenza all'85%. Saremmo sicuri del 5% che il valore reale si trova nella regione all'interno dell'intervallo del 95% ma al di fuori dell'intervallo del 90%, potremmo dire che il valore reale è probabile che scenda in quella regione. Lo stesso vale per la regione che è all'interno dell'intervallo del 90% ma al di fuori dell'intervallo dell'85%. Quindi, se tutti i valori sono ugualmente probabili, la dimensione delle precedenti 2 regioni dovrebbe essere esattamente la stessa e la stessa sarebbe valida per la regione all'interno di un intervallo di confidenza del 10% ma al di fuori di un intervallo di confidenza del 5%. Nessuna delle distribuzioni standard che gli intervalli vengono costruiti utilizzando hanno questa proprietà (tranne casi speciali con 1 disegno da un'uniforme).

Potresti dimostrarlo ulteriormente simulando un gran numero di set di dati da popolazioni conosciute, calcolando l'intervallo di confidenza dell'interesse, quindi confrontando la frequenza con cui il parametro vero è più vicino alla stima dei punti rispetto a ciascuno dei punti finali.


3
La probabilità è ciò di cui questa domanda ha bisogno nella risposta, non nella probabilità, sia frequentista che bayesiana. Il rischio fornisce esattamente la risposta, gli altri possono farlo solo con un po 'di torsione e stiramento.
Michael Lew,

1
@Greg Mi piace la tua spiegazione. Giusto per essere chiari, il tuo argomento supporta l'idea che i valori alle "code" dell'IC 95% sono meno probabili (meno probabili) di quelli più vicini alla stima puntuale, giusto? Grazie per la risposta.
pmgjones,

1
@pmgjones meno probabile, NO, vedi 2 ° paragrafo. Meno probabile nel contesto del 4o paragrafo, Sì.
Greg Snow,

2
@GregSnow Il tuo secondo paragrafo dice quasi esattamente che la probabilità che il parametro true sia il parametro true è 100%. Credi davvero che questa tautologia sia ciò che le "rigorose definizioni frequentiste" hanno da offrire?
rolando2,

2
@ rolando2, penso che le statistiche del frequentista abbiano molto da offrire, stavo semplicemente eliminando gli errori comuni che implicano cambiamenti del valore reale e talvolta sono fuori dall'intervallo e talvolta all'interno dell'intervallo (e talvolta più vicini ai confini e talvolta più vicini al centro). I paragrafi successivi ottengono quindi la sensazione più vera per le idee.
Greg Snow,

19

Questa è un'ottima domanda! C'è un concetto matematico chiamato probabilità che ti aiuterà a capire i problemi. Fisher inventò la probabilità ma la considerò in qualche modo meno desiderabile della probabilità, ma la probabilità si rivelò più "primitiva" della probabilità e Ian Hacking (1965) la considerò assiomatica in quanto non dimostrabile. La probabilità sostiene la probabilità piuttosto che il contrario.

Hacking, 1965. Logica dell'inferenza statistica .

Alla probabilità non viene data l'attenzione che dovrebbe avere nei normali manuali di statistica, senza una buona ragione. Si differenzia dalla probabilità di avere quasi esattamente le proprietà che ci si aspetterebbe e le funzioni e gli intervalli di probabilità sono molto utili per l'inferenza. Forse la statistica non è gradita da alcuni statistici perché a volte non esiste un modo "corretto" per derivare le relative funzioni di probabilità. Tuttavia, in molti casi le funzioni di probabilità sono ovvie e ben definite. Uno studio sulle probabilità di deduzione dovrebbe probabilmente iniziare con il piccolo e facile libro di Richard Royall intitolato Statistical Evidence: a Likelihood Paradigm .

La risposta alla tua domanda è che no, i punti all'interno di qualsiasi intervallo non hanno tutti la stessa probabilità. Quelli ai margini di un intervallo di confidenza di solito hanno probabilità più basse rispetto ad altri verso il centro dell'intervallo. Naturalmente, l'intervallo di confidenza convenzionale non dice nulla direttamente sul parametro relativo al particolare esperimento. Gli intervalli di confidenza di Neyman sono "globali" in quanto progettati per avere proprietà a lungo termine anziché proprietà "locali" pertinenti all'esperimento in corso. (Le prestazioni a lungo termine fortunatamente buone possono essere interpretate a livello locale, ma si tratta di una scorciatoia intellettuale piuttosto che di una realtà matematica.) Gli intervalli di probabilità - nei casi in cui possono essere costruiti - riflettono direttamente la probabilità relativa all'esperimento in mano.


1
@suncoolsu Non è necessario che l'intervallo in questione sia un intervallo di probabilità affinché l'istruzione sia vera. L'intervallo deve solo comprendere la stima più probabile in modo tale che i limiti dell'intervallo siano ciascuno meno probabile di un punto all'interno dell'intervallo. Qualsiasi intervallo di confidenza ordinario soddisferà tale requisito.
Michael Lew,

2
@pmjones Un CI del 95% NON ti dice se i valori verso i margini dell'IC sono più vicini alla verità rispetto ai valori nel mezzo. Gli EC rilasciano dichiarazioni sul campionamento ripetuto dalla popolazione. A lungo termine (ovvero, dopo ripetuti campionamenti), il 95% di tali EC, che sono costruiti per ciascun campione, coprirà il valore reale. Pertanto, ci sono due osservazioni chiave 1) Non si può dire nulla sul vero valore per un determinato CI 2) I CI non ti dicono nulla sui dati osservati, che è una solita critica bayesiana.
suncoolsu,

1
@MichaelLew Il principio di verosimiglianza è utile, ma stavo dicendo che (citando LW) "In effetti, tutta l'inferenza del frequentista viola l'LP, quindi se aderissimo all'LP dovremmo abbandonare l'inferenza del frequentatore." Poiché CI è un'idea frequentista, viola LP (che tu dici è fondamentale).
suncoolsu,

1
@suncollsu La domanda non è se un intervallo di confidenza da solo e senza altre considerazioni statistiche dica qualcosa sulla probabilità dei valori dei parametri all'interno di se stesso. Riguarda la probabilità di valori di parametro nell'intervallo. La funzione di verosimiglianza risponde alla domanda e quella risposta è corretta anche se l'intervallo di confidenza viola il principio di verosimiglianza. (Leggi di nuovo il mio commento precedente. Sembra che tu abbia ignorato del tutto il suo contenuto.)
Michael Lew,

2
@ rolando2 Gli intervalli di confidenza al 95% di Neyman sono progettati in modo tale che il metodo contenga il vero parametro nel 95% delle occasioni in cui il metodo viene utilizzato. A rigor di termini, la fiducia si lega al metodo e non a qualsiasi intervallo individuale e quindi l'intervallo individuale non ti dice nulla sullo stato del mondo in quel particolare esperimento. Vedi la mia risposta a questa domanda per maggiori dettagli: stats.stackexchange.com/questions/8844/…
Michael Lew

18

Supponiamo che qualcuno mi abbia detto che dovrei riporre la stessa fiducia in tutti i valori all'interno di un CI95 come potenziali indicatori del valore della popolazione. (Evito deliberatamente i termini "probabile" e "probabile".) Cosa c'è di speciale in 95? Niente: per essere coerente, dovrei anche riporre la stessa fiducia in tutti i valori all'interno di un CI96, un CI97, ... e un CI99.9999999. Man mano che la copertura dell'IC si avvicinava al limite, praticamente tutti i numeri reali dovevano essere inclusi. La assurdità di questa conclusione mi porterebbe a respingere la richiesta iniziale.


4
Questa è un'ottima risposta! Avrei dovuto pensare all'effetto dell'avvicinarsi degli estremi di possibili EC. Grazie per aver scritto questo!
pmgjones,

2

Cominciamo con la definizione di un intervallo di confidenza. Se dico che un intervallo di confidenza del 95% va da questo a quello, intendo che affermazioni di tale natura saranno vere circa il 95% delle volte e false circa il 5% delle volte. Io non necessariamente significa che io sono il 95% fiducioso per questa particolare dichiarazione. Un intervallo di confidenza del 90% sarà più stretto e un 80% ancora più stretto. Pertanto, quando mi chiedo quale sia il vero valore, ho meno credibilità nei valori man mano che si avvicinano sempre più al limite di ogni particolare intervallo di confidenza.

Si noti che tutto quanto sopra è qualitativo, in particolare "credenza". (Ho evitato il termine "fiducia" o "verosimiglianza" in quell'affermazione perché portano un bagaglio matematico che può differire dal nostro bagaglio intuitivo.) Gli approcci bayesiani riformulerebbero la tua domanda a qualcosa che abbia una risposta quantitativa ma non voglio aprire quella lattina di vermi qui.

Anche il testo classico di Box & Hunter ("Statistics for Experimenters", Wiley, 1978) può essere d'aiuto. Vedere "Set di intervalli di confidenza" a pag. 113, segg.


Dato che ci occupiamo in parte dei concetti e in parte della semantica, ti faccio notare che nella tua seconda frase hai detto "... affermazioni di quella natura saranno vere ..." senza specificare quali affermazioni sarebbero vere.
rolando2,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.