Perché un intervallo di confidenza al 95% (CI) non implica una probabilità del 95% di contenere la media?


228

Sembra che, attraverso varie domande correlate qui, vi sia consenso sul fatto che la parte "95%" di ciò che chiamiamo un "intervallo di confidenza al 95%" si riferisce al fatto che se dovessimo replicare esattamente le nostre procedure di campionamento e calcolo dell'IC più volte , Il 95% degli EC così calcolati conterrebbe la media della popolazione. Sembra anche essere d'accordo sul fatto che questa definizione non lo siaconsentire a uno di concludere da un singolo IC al 95% che esiste una probabilità del 95% che la media ricada da qualche parte all'interno dell'IC. Tuttavia, non capisco come il primo non implichi il secondo in quanto, avendo immaginato molti IC del 95% dei quali contengono la media della popolazione, non dovrebbe la nostra incertezza (per quanto riguarda se il nostro IC effettivamente calcolato contenga la popolazione medio o no) ci costringono a utilizzare il tasso base dei casi immaginati (95%) come nostra stima della probabilità che il nostro caso reale contenga l'IC?

Ho visto postare argomenti sulla falsariga di "la CI effettivamente calcolata contiene la media della popolazione o no, quindi la sua probabilità è 1 o 0", ma questo sembra implicare una strana definizione di probabilità che dipende su stati sconosciuti (cioè un amico lancia una moneta giusta, nasconde il risultato e non mi viene detto che c'è una probabilità del 50% che sia testa).

Sicuramente mi sbaglio, ma non vedo dove la mia logica sia andata storta ...


4
Per "casualità", intendi "probabilità" nel senso tecnico frequentista o nel senso bayesiano di plausibilità soggettiva? Nel senso frequentista, solo gli eventi di esperimenti casuali hanno una probabilità. Osservare tre numeri (fissi) dati (media reale, limiti di CI calcolati) per determinare il loro ordine (media reale contenuta in CI?) Non è un esperimento casuale. Questo è anche il motivo per cui la parte di probabilità di "CI effettivamente calcolata contiene la media della popolazione o no, quindi la sua probabilità è 1 o 0" è anch'essa sbagliata. Un modello di probabilità frequentista non si applica in quel caso.
Caracal,

11
Dipende da come tratti la media teorica. Se è una variabile casuale, allora puoi dire della probabilità che rientri in un certo intervallo. Se è costante, non puoi. Questa è la spiegazione più semplice, che ha chiuso questo problema per me personalmente.
mpiktas,

2
Per inciso, mi sono imbattuto in questo discorso, da Thaddeus Tarpey: tutti i modelli hanno ragione ... la maggior parte sono inutili . Ha discusso della questione della probabilità che un intervallo di confidenza al 95% contenga (p. 81 e seguenti)? μ
chl

3
@Nesp: non credo ci siano problemi con l'affermazione "La probabilità è zero o uno" in riferimento alla probabilità (posteriore) che un elemento della configurazione contenga un parametro (fisso). (Questo non ha nemmeno in realtà si basa su ogni interpretazione frequentista della probabilità!). Inoltre, non si basa su "stati sconosciuti". Tale affermazione si riferisce precisamente alla situazione in cui viene consegnato un elemento della configurazione basato su un particolare campione. È un semplice esercizio matematico per dimostrare che tale probabilità è banale, vale a dire che assume valori in . {0,1}
cardinale il

3
@MikeLawrence dopo tre anni, sei soddisfatto della definizione di un intervallo di confidenza del 95% come questo: "se ripetessimo ripetutamente il campionamento dalla popolazione e calcolassimo un intervallo di confidenza al 95% dopo ogni campione, il 95% del nostro intervallo di confidenza conterrebbe la media ". Come te nel 2012, faccio fatica a vedere come questo non implica che un intervallo di confidenza del 95% abbia una probabilità del 95% di contenere la media. Sarei interessato a vedere come è progredita la tua comprensione di un intervallo di confidenza da quando hai posto questa domanda.
luciano,

Risposte:


107

Parte del problema è che la definizione frequentista di una probabilità non consente di applicare una probabilità non banale al risultato di un particolare esperimento, ma solo a una popolazione fittizia di esperimenti da cui questo particolare esperimento può essere considerato un campione. La definizione di un elemento della configurazione è confusa in quanto è un'affermazione su questa popolazione (solitamente) fittizia di esperimenti, piuttosto che sui dati particolari raccolti nell'istanza in questione. Quindi parte del problema è la definizione di una probabilità: l'idea del vero valore che giace in un determinato intervallo con una probabilità del 95% è incoerente con un quadro frequentista.

Un altro aspetto del problema è che il calcolo della fiducia del frequentatore non utilizza tutte le informazioni contenute nel particolare campione rilevanti per limitare il vero valore della statistica. La mia domanda "Esistono esempi in cui gli intervalli credibili bayesiani sono ovviamente inferiori agli intervalli di confidenza del frequentista"discute un articolo di Edwin Jaynes che contiene alcuni esempi davvero validi che evidenziano davvero la differenza tra intervalli di confidenza e intervalli credibili. Uno che è particolarmente rilevante in questa discussione è l'esempio 5, che discute la differenza tra un intervallo credibile e un intervallo di confidenza per stimare il parametro di una distribuzione esponenziale troncata (per un problema nel controllo di qualità industriale). Nell'esempio che fornisce, ci sono abbastanza informazioni nel campione per essere certi che il vero valore del parametro non si trova da nessuna parte in un intervallo di confidenza del 90% correttamente costruito!

Questo può sembrare scioccante per alcuni, ma la ragione di questo risultato è che gli intervalli di confidenza e gli intervalli credibili sono risposte a due domande diverse, da due diverse interpretazioni della probabilità.

L'intervallo di confidenza è la risposta alla richiesta: "Dammi un intervallo che racchiuda il valore reale del parametro nel % delle istanze di un esperimento che viene ripetuto un gran numero di volte". L'intervallo credibile è una risposta alla richiesta: "Dammi un intervallo che racchiuda il valore reale con probabilità dato il particolare campione che ho effettivamente osservato. " Per poter rispondere a quest'ultima richiesta, dobbiamo prima adottare uno dei due (a ) un nuovo concetto del processo di generazione dei dati o (b) un diverso concetto della definizione di probabilità stessa. p100pp

Il motivo principale per cui un determinato intervallo di confidenza al 95% non implica una probabilità del 95% di contenere la media è perché l'intervallo di confidenza è una risposta a una domanda diversa, quindi è solo la risposta giusta quando si verifica la risposta alle due domande avere la stessa soluzione numerica.

In breve, intervalli credibili e di fiducia rispondono a domande diverse da diverse prospettive; entrambi sono utili, ma è necessario scegliere l'intervallo giusto per la domanda che si desidera porre. Se si desidera un intervallo che ammetta un'interpretazione di una probabilità (posteriore) del 95% di contenere il valore reale, quindi scegliere un intervallo credibile (e, con esso, la concettualizzazione della probabilità relativa), non un intervallo di confidenza. La cosa che non dovresti fare è adottare una diversa definizione di probabilità nell'interpretazione rispetto a quella usata nell'analisi.

Grazie a @cardinal per i suoi perfezionamenti!

Ecco un esempio concreto, dall'eccellente libro di David MaKay "Teoria dell'informazione, inferenza e algoritmi di apprendimento" (pagina 464):

Lascia che il parametro di interesse sia e i dati , una coppia di punti e disegnati indipendentemente dalla seguente distribuzione:D x 1 x 2θDx1x2

p(x|θ)={1/2x=θ,1/2x=θ+1,0otherwise

Se è , ci aspetteremmo di vedere i set di dati , , e tutti con uguale probabilità . Considera l'intervallo di confidenza39 ( 39 , 39 ) ( 39 , 40 ) ( 40 , 39 ) ( 40 , 40 ) 1 / 4θ39(39,39)(39,40)(40,39)(40,40)1/4

[θmin(D),θmax(D)]=[min(x1,x2),max(x1,x2)] .

Chiaramente questo è un intervallo di confidenza del 75% valido perché se si ricampionano i dati, , molte volte l'intervallo di confidenza costruito in questo modo conterrebbe il valore reale del 75% delle volte.D=(x1,x2)

Consideriamo ora i dati . In questo caso l'intervallo di confidenza del 75% frequentista sarebbe . Tuttavia, supponendo che il modello del processo di generazione sia corretto, in questo caso potrebbe essere 28 o 29 e non abbiamo motivo di supporre che 29 abbia più probabilità di 28, quindi la probabilità posteriore è . Quindi, in questo caso, l'intervallo di confidenza del frequentista non è chiaramente un intervallo credibile del 75% in quanto esiste solo una probabilità del 50% che contenga il vero valore di , dato ciò che possiamo dedurre su da questo particolare campione .[ 29D=(29,29)θ p ( θ = 28 | D ) = p ( θ = 29 | D ) = 1 / 2 θ θ[29,29]θp(θ=28|D)=p(θ=29|D)=1/2θθ

Sì, questo è un esempio inventato, ma se gli intervalli di confidenza e gli intervalli credibili non fossero diversi, sarebbero comunque identici negli esempi inventati.

Nota la differenza chiave è che l'intervallo di confidenza è un'affermazione su cosa accadrebbe se ripetessi l'esperimento più volte, l'intervallo credibile è un'affermazione su ciò che può essere dedotto da questo particolare esempio.


8
L'intervallo di confidenza è la risposta alla domanda "dammi un intervallo che racchiuderà il vero valore della statistica con probabilità p se l'esperimento viene ripetuto un gran numero di volte". L'intervallo credibile è una risposta alla domanda "dammi un intervallo che racchiuda il valore vero con probabilità p". Prima di tutto, l'affermazione relativa a un'interpretazione frequente della probabilità lascia a desiderare. Forse, il problema sta nell'uso della parola probabilità in quella frase. In secondo luogo, trovo che l'intervallo "definizione" credibile sia un po 'troppo semplicistico ...
cardinale

7
... e leggermente fuorviante considerando la caratterizzazione che dai a un elemento della configurazione. In una prospettiva correlata, la frase di chiusura presenta lo stesso problema: se si desidera un intervallo che contenga il valore reale il 95% delle volte, scegliere un intervallo credibile, non un intervallo di confidenza. L'uso colloquiale di "contiene il valore reale il 95% delle volte" è un po 'impreciso e lascia un'impressione sbagliata. In effetti, posso argomentare in modo convincente (credo) che una tale formulazione è molto più vicina all'essere la definizione di un elemento della configurazione.
cardinale il

11
Richiesta : sarebbe utile per il downvoter rispondere a questa risposta per esprimere la propria opinione / motivazione nei commenti. Sebbene questa domanda sia un po 'più probabile rispetto alla maggior parte di essa porta a discussioni estese, è comunque utile fornire un feedback costruttivo ai rispondenti; questo è uno dei modi più semplici per aiutare a migliorare il contenuto complessivo del sito. Saluti.
cardinale il

9
Dikran, sì, sono d'accordo. Questo faceva parte di ciò che stavo cercando di elaborare un po 'di più nelle modifiche. Un frequentatore radicale (che certamente non sono ) potrebbe affermarlo in modo provocatorio come: "Un CI è conservatore in quanto progetto in anticipo l'intervallo in modo tale che, indipendentemente da quali dati particolari mi capita di osservare, il parametro verrà catturato nell'intervallo del 95% del tempo. Un intervallo credibile nasce dal dire 'Oops, qualcuno mi ha appena lanciato alcuni dati in grembo. Qual è la probabilità che l'intervallo che costruisco da quei dati contenga il vero parametro?' "Questo è un po 'ingiusto in quest'ultimo caso ... .
Il cardinale

2
Dikran, veniamo tutti da ambienti diversi e questo aiuta ad arricchire la nostra comprensione. Per quanto riguarda la probabilità e i concetti correlati, forse il pensatore più brillante con cui ho avuto il piacere di interagire non aveva una statistica formale o un background di probabilità (matematico); era un ingegnere.
cardinale il

28

Nella statistica frequentista le probabilità riguardano eventi a lungo termine. Non si applicano a un singolo evento dopo che è stato fatto. E l'esecuzione di un esperimento e il calcolo dell'IC è proprio un evento del genere.

Volevi confrontarlo con la probabilità che una moneta nascosta fosse la testa ma non puoi. Puoi metterlo in relazione con qualcosa di molto vicino. Se il tuo gioco ha una regola in cui devi dichiarare dopo che "capovolgi", allora la probabilità che tu abbia ragione a lungo termine è del 50% e questo è analogo.

Quando esegui l'esperimento e raccogli i tuoi dati, hai qualcosa di simile al vero lancio della moneta. Il processo dell'esperimento è come il processo del lancio della moneta in quanto generaμμo non solo come la moneta è testa o non lo è. Una volta che lanci la moneta, che tu la veda o no, non c'è alcuna probabilità che sia testa, sia testa o no. Supponiamo che tu chiami teste. Questo è il calcolo dell'IC. Perché non puoi mai rivelare la moneta (la tua analogia con un esperimento svanirebbe). O hai ragione o sbagli, tutto qui. Il suo stato attuale ha qualche relazione con la probabilità che si presenti in testa al prossimo lancio o che avrei potuto prevedere di cosa si tratta? No. Il processo con cui viene prodotta la testa ha una probabilità 0,5 di produrle, ma ciò non significa che una testa già esistente abbia una probabilità 0,5 di essere. Una volta calcolato il tuo CI non c'è alcuna probabilità che catturiμo lo fa o non lo fa - hai già lanciato la moneta.

OK, penso di averlo torturato abbastanza. Il punto critico è che la tua analogia è sbagliata. Non puoi mai rivelare la moneta; puoi solo chiamare teste o code basate su ipotesi sulle monete (esperimenti). Potresti voler fare una scommessa dopo che la tua testa o la coda sono corrette, ma non puoi mai accumularla. Inoltre, è un componente critico della procedura CI che stai dichiarando che il valore dell'importazione è nell'intervallo. Se non lo fai, non hai un elemento della configurazione (o almeno non uno alla% indicata).

Probabilmente la cosa che confonde l'IC è il suo nome. È un intervallo di valori che contengono o non contengono . Pensiamo che contengano ma la probabilità che ciò non sia la stessa del processo che è stato sviluppato. La parte del 95% del nome dell'IC al 95% riguarda solo il processo. È possibile calcolare un intervallo che si ritiene contenga seguito a un certo livello di probabilità, ma questo è un calcolo diverso e non un CI.μ μμμμ

È meglio pensare al nome IC 95% come una designazione di un tipo di misurazione di un intervallo di valori che ritieni plausibilmente contenere e separare il 95% da quella plausibilità. Potremmo chiamarlo Jennifer CI mentre il 99% CI è Wendy CI. Questo potrebbe effettivamente essere migliore. Quindi, in seguito, possiamo dire che crediamo che sia probabilmente compreso nell'intervallo di valori e nessuno rimarrebbe bloccato dicendo che esiste una probabilità Wendy che abbiamo catturato . Se desideri una diversa designazione, penso che probabilmente dovresti sentirti libero di sbarazzarti anche della parte "confidenza" di CI (ma è un intervallo).μ μμμμ


Per essere onesti questa risposta sembra ok, ma mi piacerebbe vederne una descrizione (matematica) formale. Con formale, intendo convertirlo in eventi. Spiegherò il mio punto: ricordo di essere stato molto confuso con i valori all'inizio. Da qualche parte ho letto che "quali sono i valori effettivamente calcolati sono la probabilità dei dati dato che l'ipotesi nulla, , è vera". Quando ho messo in relazione questo con il teorema di Bayes, tutti avevano così tanto senso che ora posso spiegarlo a tutti (cioè che si calcola ). Tuttavia, (ironicamente) non sono così sicuro ...p H 0 p ( D | H 0 )ppH0p(D|H0)
Néstor,

... (continua) con intervalli di confidenza: c'è un modo per esprimere ciò che hai detto in termini di conoscenza? In freq. statistiche. uno di solito calcola una stima puntuale, , con qualche metodo (es. MLE). Esiste un modo per scrivere (ad esempio con un intervallo posteriore centrale bayesiano, con il "vero significato") in funzione di (ovvero che cosa è realmente il % degli intervalli di confidenza), come quando puoi esprimere come una funzione di ? Intuitivamente ho sempre pensato che potesse essere fatto, ma non l'ho mai fatto. P(L1( μ )<μ<L2( ^ m u )|D)μP(L ' 1 < ˉ X -μ<L ' 2 )=alfaalfap(H0|D)p(D|H0)μ^P(L1(μ^)<μ<L2(mu^)|D)μP(L1<X¯μ<L2)=ααp(H0|D)p(D|H0)
Néstor

A volte essere in grado di eliminare i commenti ha i suoi svantaggi. Non ho potuto tenere il passo con i rapidi cambiamenti, in questo caso!
cardinale il

1
" Se non calcoli il tuo intervallo di confidenza hai qualcosa di simile alla moneta nascosta e ha una probabilità del 95% di contenere mu proprio come la moneta ha una probabilità del 50% di essere teste. " - Penso che tu abbia l'analogia qui è sbagliata. "Calcolare l'IC" non corrisponde alla rivelazione della moneta, corrisponde alla chiamata "Testa" o "Croce", a quel punto hai ancora una probabilità del 50-50 di avere ragione. Rivelare la moneta corrisponde a * vedere il valore della popolazione di , a quel punto puoi rispondere alla domanda se è nell'intervallo "chiamato". Il puzzle dell'OP rimane. μ
Glen_b,

1
@vonjd, non vedo cosa non abbia senso. È ovviamente ovvio che il tuo avversario ha un colore o no. Se il primo, la probabilità è (banalmente) 1, e se il secondo 0. Di conseguenza, non si può ragionevolmente dire che la probabilità è .198. Questo ha perfettamente senso. Prima di fare la mano, è ragionevole parlare della probabilità di ricevere una scala. Allo stesso modo, prima di pescare una carta, è ragionevole parlare della probabilità di ottenere il seme di cui hai bisogno. Dopo aver ottenuto la carta, è semplicemente qualunque seme sia.
gung

22

Idee formali ed esplicite su argomenti, inferenza e logica hanno avuto origine, all'interno della tradizione occidentale, con Aristotele. Aristotele ha scritto su questi argomenti in diversi lavori (incluso uno chiamato Argomenti ;-)). Tuttavia, il singolo principio di base è La legge della non contraddizione , che può essere trovata in vari luoghi, tra cui la metafisicalibro IV, capitoli 3 e 4. Una formulazione tipica è: "... è impossibile che qualsiasi cosa sia allo stesso tempo e non sia [nello stesso senso]" (1006 a 1). La sua importanza è stata dichiarata leggermente prima, "... questo è naturalmente il punto di partenza anche per tutti gli altri assiomi" (1005 b 30). Perdonami per avermi fatto filosofico, ma questa domanda per sua natura ha un contenuto filosofico che non può essere semplicemente scartato per comodità.

Considera questo esperimento mentale: Alex lancia una moneta, la prende e la gira sull'avambraccio con la mano che copre il lato rivolto verso l'alto. Bob era nella giusta posizione; vide brevemente la moneta nella mano di Alex, e quindi ora può dedurre da che parte sta affrontando. Tuttavia, Carlos non ha visto la moneta - non era nel posto giusto. A questo punto, Alex chiede loro quale sia la probabilità che la moneta mostri delle teste. Carlos suggerisce che la probabilità è 0,5, poiché questa è la frequenza a lungo termine delle teste. Bob non è d'accordo, afferma con sicurezza che la probabilità non è altro che esattamente 0 .

Ora chi ha ragione? È possibile, ovviamente, che Bob abbia visto male ed è errato (supponiamo che non abbia visto male). Tuttavia, non si può sostenere che entrambi abbiano ragione e si attengano alla legge della non contraddizione. (Suppongo che se non credi nella legge di non contraddizione, potresti pensare che abbiano entrambi ragione, o qualche altra formulazione simile.) Ora immagina un caso simile, ma senza Bob presente, il suggerimento di Carlos potrebbe essere più giusto (eh?) senza Bob in giro, visto che nessuno ha visto la moneta? L'applicazione della legge di non contraddizione non è così chiara in questo caso, ma penso sia ovvio che le parti della situazione che sembrano importanti siano mantenute costanti dalla prima alla seconda. Ci sono stati molti tentativi di definire la probabilità e in futuro potrebbero essercene ancora molti altri, ma una definizione di probabilità in funzione di chi capita di essere in piedi e dove si trovano posizionati ha poco appello. In ogni caso (indovinando usando la frase "intervallo di confidenza "), stiamo lavorando all'interno dell'approccio frequentista, e in questo caso se qualcuno sa che il vero stato della moneta è irrilevante. Non è una variabile casuale - è un valore realizzato e mostra le teste o mostra le code .

Come osserva @John, lo stato di una moneta potrebbe non sembrare inizialmente simile alla domanda se un intervallo di confidenza copre la vera media. Tuttavia, invece di una moneta, possiamo comprenderlo astrattamente come un valore realizzato tratto da una distribuzione di Bernoulli con il parametro . Nella situazione della moneta, , mentre per un IC al 95%, . La cosa importante da realizzare nel creare la connessione è che la parte importante della metafora non è la che governa la situazione, ma piuttosto che la moneta lanciata o la CI calcolata è un valore realizzato , non una variabile casuale. p = .5 p = .95 ppp=.5p=.95p

È importante per me notare a questo punto che tutto questo è il caso all'interno di una concezione frequentista della probabilità. La prospettiva bayesiana non viola la legge della non contraddizione, ma parte semplicemente da diverse ipotesi metafisiche sulla natura della realtà (più specificamente sulla probabilità). Altri su CV sono molto più esperti nella prospettiva bayesiana di me, e forse potrebbero spiegare perché le ipotesi alla base della tua domanda non si applicano nell'approccio bayesiano e che, in effetti, potrebbe esserci una probabilità del 95% della media che rientra in un 95% credibileintervallo, in determinate condizioni incluso (tra gli altri) che il precedente usato era accurato (vedi il commento di @DikranMarsupial di seguito). Tuttavia, penso che tutti sarebbero d'accordo, sul fatto che una volta che affermi di lavorare nell'ambito dell'approccio frequentista, non può essere il caso in cui la probabilità della vera media che si trova all'interno di un determinato IC al 95% sia di .95.


5
Sotto l'approccio bayesiano non è vero che esiste effettivamente una probabilità del 95% che il valore reale si trovi in ​​un intervallo credibile del 95%. Sarebbe più corretto affermare che, data una particolare distribuzione precedente per il valore della statistica (che rappresenta il nostro stato iniziale di conoscenza), dopo aver osservato i dati abbiamo una distribuzione posteriore che rappresenta il nostro stato di conoscenza aggiornato, che ci dà un intervallo in cui siamo certi al 95% che il vero valore risiede. Questo sarà accurato solo se il nostro precedente è accurato (e altre ipotesi come la forma della probabilità).
Dikran Marsupial,

@DikranMarsupial, grazie per la nota. È un po 'un boccone. Ho modificato la mia risposta per renderla più coerente con il tuo suggerimento, ma non l'ho copiata in toto . Fammi sapere se ulteriori modifiche sono appropriate.
gung

Fondamentalmente l'approccio bayesiano è meglio interpretato come una dichiarazione del tuo stato di conoscenza riguardo al parametro di interesse (vedi cardinale, sto imparando; o), ma non garantisce che tale stato di conoscenza sia corretto a meno che tutte le ipotesi non siano corrette . Mi è piaciuta la discussione filosofica, dovrò ricordare la legge di non contraddizione per la prossima volta che discuterò della logica fuzzy; o)
Dikran Marsupial

12

Perché un IC al 95% non implica una probabilità del 95% di contenere la media?

Vi sono molte questioni da chiarire in questa domanda e nella maggior parte delle risposte fornite. Mi limiterò solo a due di loro.

un. Cosa significa una popolazione? Esiste una vera popolazione?

Il concetto di popolazione media dipende dal modello. Poiché tutti i modelli sono sbagliati, ma alcuni sono utili, questa media della popolazione è una finzione definita solo per fornire interpretazioni utili. La finzione inizia con un modello di probabilità.

Il modello di probabilità è definito dalla tripletta dove è lo spazio campione (un set non vuoto), è una famiglia dei sottoinsiemi di e è una misura di probabilità ben definita definita su (regola il comportamento dei dati). Senza perdita di generalità, considera solo il caso discreto. La media della popolazione è definita da ovvero rappresenta la tendenza centrale sotto e può anche essere interpretata come il centro di massa di tutti i punti in , in cui il peso di ciascuno

(X,F,P),
XFXPF
μ=xXxP(X=x),
PXxX è dato da .P(X=x)

Nella teoria della probabilità, la misura è considerata nota, quindi la media della popolazione è accessibile attraverso l'operazione semplice sopra. Tuttavia, in pratica, la probabilità è poco nota. Senza una probabilità , non si può descrivere il comportamento probabilistico dei dati. Dato che non possiamo impostare una probabilità precisa per spiegare il comportamento dei dati, impostiamo una famiglia contenente misure di probabilità che probabilmente governano (o spiegano) il comportamento dei dati. Quindi, emerge il modello statistico classico Si dice che il modello sopra sia un modello parametrico se esiste conPPPPM

(X,F,M).
ΘRpp< tale che . Consideriamo solo il modello parametrico in questo post.M{Pθ: θΘ}

Si noti che, per ogni misura di probabilità , esiste una rispettiva definizione media Cioè, esiste una famiglia di popolazione che significa che dipende strettamente dalla definizione di . La famiglia è definita da esseri umani limitati e pertanto potrebbe non contenere la vera misura di probabilità che regola il comportamento dei dati. In realtà, la famiglia scelta difficilmente conterrà la vera misura, inoltre questa vera misura potrebbe non esistere nemmeno. Poiché il concetto di media della popolazione dipende dalle misure di probabilità in , la media della popolazione dipende dal modello.PθM

μθ=xXxPθ(X=x).
{μθ: θΘ}MMM

L'approccio bayesiano considera una probabilità precedente rispetto ai sottoinsiemi di (o, equivalentemente, ), ma in questo post mi concentrerò solo sulla versione classica.MΘ

b. Qual è la definizione e lo scopo di un intervallo di confidenza?

Come accennato in precedenza, la media della popolazione dipende dal modello e fornisce interpretazioni utili. Tuttavia, abbiamo una famiglia di mezzi di popolazione, perché il modello statistico è definito da una famiglia di misure di probabilità (ogni misura di probabilità genera una media della popolazione). Pertanto, sulla base di un esperimento, dovrebbero essere impiegate procedure inferenziali per stimare un piccolo insieme (intervallo) contenente buoni candidati di mezzi di popolazione. Una procedura ben nota è l' area di confidenza ( ), che è definita da un set tale che, per tutti , dove1αCαθΘ

Pθ(Cα(X)μθ)1α   and   infθΘPθ(Cα(X)μθ)=1α,
Pθ(Cα(X)=)=0 (vedi Schervish, 1995). Questa è una definizione molto generale e comprende praticamente qualsiasi tipo di intervalli di confidenza. Qui, è la probabilità che contenga sotto la misura . Questa probabilità dovrebbe essere sempre maggiore di (o uguale a) , l'uguaglianza si verifica nel caso peggiore.Pθ(Cα(X)μθ)Cα(X)μθPθ1α

Nota: i lettori dovrebbero notare che non è necessario formulare ipotesi sullo stato della realtà, la regione di confidenza è definita per un modello statistico ben definito senza fare riferimento a qualsiasi mezzo "vero". Anche se la misura della probabilità "vera" non esiste o non è in , la definizione della regione di confidenza funzionerà, poiché le ipotesi riguardano la modellistica statistica piuttosto che gli stati di realtà.M

Da un lato, prima di osservare i dati, è un insieme casuale (o intervallo casuale) e la probabilità che " contenga la media " è almeno per tutti . Questa è una caratteristica molto desiderabile per il paradigma frequentista.Cα(X)Cα(X)μθ(1α)θΘ

D'altra parte, dopo aver osservato i dati , è solo un insieme fisso e la probabilità che " contenga la media " dovrebbe essere in {0,1} per all .xCα(x)Cα(x)μθθΘ

Cioè, dopo aver osservato i dati , non possiamo più utilizzare il ragionamento probabilistico. Per quanto ne so, non esiste una teoria per trattare i set di confidenza per un campione osservato (ci sto lavorando e sto ottenendo dei buoni risultati). Per un po ', il frequentatore deve credere che l'insieme (o intervallo) osservato sia uno degli insiemi che contiene per tutti .C α ( x ) ( 1 - α ) 100 % μ θ θ ΘxCα(x)(1α)100%μθθΘ

PS: invito commenti, recensioni, critiche o persino obiezioni al mio post. Discutiamolo in profondità. Dato che non sono un madrelingua inglese, il mio post contiene sicuramente errori di battitura e grammatica.

Riferimento:

Schervish, M. (1995), Theory of Statistics, Second ed, Springer.


Qualcuno vuole discuterne?
Alexandre Patriota,

4
Le discussioni possono verificarsi in chat, ma non sono appropriate sul nostro sito principale. Consulta il nostro centro assistenza per ulteriori informazioni su come funziona. Nel frattempo, sono perplesso dalla formattazione del tuo post: quasi tutto è formattato come un'offerta. Hai estratto questo materiale da una fonte pubblicata o è il tuo, appena scritto per questa risposta? In quest'ultimo caso, rimuovi le citazioni!
whuber

2
(+1). Grazie per una sinossi straordinariamente chiara. Benvenuti nel nostro sito!
whuber

11

Sono sorpreso che nessuno abbia sollevato l'esempio di Berger di un intervallo di confidenza sostanzialmente inutile del 75% descritto nel secondo capitolo di "Il principio di verosimiglianza". I dettagli possono essere trovati nel testo originale (che è disponibile gratuitamente sul Progetto Euclide ): ciò che è essenziale nell'esempio è che descrive, senza ambiguità, una situazione in cui si conosce con assoluta certezza il valore di un parametro apparentemente sconosciuto dopo osservando i dati, ma affermeresti di avere solo il 75% di confidenza che il tuo intervallo contenga il valore reale. Analizzare i dettagli di quell'esempio è stato ciò che mi ha permesso di comprendere l'intera logica della costruzione di intervalli di confidenza.


8
In un ambiente frequentista, non si "asserirebbe che si ha solo il 75% di confidenza che il proprio intervallo contenga il valore reale" in riferimento a un elemento della configurazione, in primo luogo. Qui sta il nocciolo del problema. :)
cardinale

1
puoi fornire un link diretto / riferimento alla pagina a quell'esempio? Ho cercato il capitolo ma non sono riuscito a identificare l'esempio corretto.
Ronald,

@Ronald: è il primo nella prima pagina del capitolo 2. Un collegamento diretto sarebbe una gradita aggiunta.
cardinale il

1
Link come richiesto. Ah sì. In questo esempio, sembra chiaro: se facciamo un esperimento, c'è una probabilità del 75% che l'intervallo di confidenza risultante sarà conterrà la media. Una volta che abbiamo fatto l'esperimento e sappiamo come si è svolto, tale probabilità può essere diversa, a seconda della distribuzione del campione risultante.
Ronald,

7

Non so se questo dovrebbe essere posto come una nuova domanda, ma sta affrontando la stessa domanda posta sopra proponendo un esperimento mentale.

In primo luogo, suppongo che se seleziono una carta da gioco a caso da un mazzo standard, la probabilità che io abbia selezionato una mazza (senza guardarla) è 13/52 = 25%.

E in secondo luogo, è stato affermato molte volte che un intervallo di confidenza del 95% dovrebbe essere interpretato in termini di ripetizione di un esperimento più volte e l'intervallo calcolato conterrà la vera media del 95% delle volte - penso che questo sia stato dimostrato in modo ragionevolmente convincente da James Waters simulazione. La maggior parte delle persone sembra accettare questa interpretazione di un IC al 95%.

Ora, per l'esperimento mentale. Supponiamo di avere una variabile normalmente distribuita in una vasta popolazione - forse altezze di maschi o femmine adulti. Ho un assistente disponibile e instancabile che ho il compito di eseguire più processi di campionamento di una determinata dimensione del campione dalla popolazione e calcolare la media del campione e l'intervallo di confidenza al 95% per ciascun campione. Il mio assistente è molto appassionato e riesce a misurare tutti i possibili campioni dalla popolazione. Quindi, per ciascun campione, il mio assistente registra l'intervallo di confidenza risultante come verde (se l'elemento della configurazione contiene la media vera) o rosso (se l'elemento della configurazione non contiene la media vera). Sfortunatamente, il mio assistente non mi mostrerà i risultati dei suoi esperimenti. Ho bisogno di ottenere alcune informazioni sulle altezze degli adulti nella popolazione, ma ho solo tempo, risorse e pazienza per fare l'esperimento una volta. Faccio un singolo campione casuale (delle stesse dimensioni del campione usato dal mio assistente) e calcolo l'intervallo di confidenza (usando la stessa equazione).

Non ho modo di vedere i risultati del mio assistente. Quindi, qual è la probabilità che il campione casuale che ho selezionato produca un CI verde (ovvero che l'intervallo contenga la media vera)?

A mio avviso, questo è lo stesso della situazione del mazzo di carte delineata in precedenza e può essere interpretata con una probabilità del 95% che l'intervallo calcolato contenga la media reale (ovvero è verde). Eppure, il consenso sembra essere che un intervallo di confidenza al 95% NON possa essere interpretato come una probabilità del 95% che l'intervallo contenga la media vera. Perché (e dove) il mio ragionamento nell'esperimento di pensiero sopra cade a pezzi?


+1 Questo è un resoconto straordinariamente chiaro della progressione concettuale da una popolazione normale a una situazione di campionamento binario. Grazie per averlo condiviso con noi e benvenuti nel nostro sito!
whuber

Si prega di inviare questo come una domanda.
Giovanni,

Grazie per il commento, John. Ora sono stati pubblicati come una domanda separata ( stats.stackexchange.com/questions/301478/… ).
user1718097,

4

Mentre ci sono state ampie discussioni nelle numerose grandi risposte, voglio aggiungere una prospettiva più semplice. (sebbene sia stato accennato in altre risposte - ma non esplicitamente.) Per alcuni parametri e dato un campione , un intervallo di confidenza è un'istruzione di probabilità del moduloθ(X1,X2,,Xn)100p%

P(g(X1,X2,,Xn)<θ<f(X1,X2,,Xn))=p

Se consideriamo ad essere una costante, allora la dichiarazione di cui sopra è di circa il variabili casuali e , o, più precisamente, si tratta di l'intervallo casuale .θg(X1,X2,,Xn)f(X1,X2,,Xn)(g(X1,X2,,Xn),f(X1,X2,,Xn))

Quindi, invece di fornire qualsiasi informazione sulla probabilità che il parametro sia contenuto nell'intervallo, fornisce informazioni sulla probabilità dell'intervallo contenente il parametro, poiché l'intervallo è costituito da variabili casuali.


3

Ai fini pratici, non hai più torto a scommettere che il tuo IC al 95% includeva la vera media con probabilità 95: 5, che devi scommettere sul lancio della moneta del tuo amico con probabilità 50:50.

Se il tuo amico ha già lanciato la moneta e pensi che ci sia una probabilità del 50% di essere testa, allora stai solo usando una diversa definizione della parola probabilità. Come altri hanno già detto, per i frequentatori non è possibile assegnare una probabilità a un evento che si è verificato, ma piuttosto è possibile descrivere la probabilità che un evento si verifichi in futuro utilizzando un determinato processo.

Da un altro blog: il frequentista dirà: "Un evento particolare non può avere probabilità. La moneta mostra testa o croce e, a meno che tu non lo mostri, semplicemente non posso dire quale sia il fatto. Solo se ripetessi il sorteggio molte, molte volte, comunque, se si modificano abbastanza fortemente le condizioni iniziali dei lanci, mi aspetto che la frequenza relativa delle teste in tutti questi lanci si avvicini a 0,5 ". http://www.researchgate.net/post/What_is_the_difference_between_frequentist_and_bayesian_probability


2
Quel blog sembra una discussione da uomo di paglia. Sembra confondere una filosofia di probabilità con una sorta di limitazione (inesistente) inerente alla capacità di creare modelli di probabilità. Non riconosco alcuna forma di metodologie o metodologie statistiche classiche in quella caratterizzazione. Tuttavia, penso che la tua conclusione finale sia buona, ma il linguaggio che utilizza, non chiarendo che la scommessa riguarda l' IC e non la media, rischia di creare una forma di confusione che questa domanda intende affrontare.
whuber

1
Un modo che vedo spesso usato è di sottolineare che l'IC è il risultato di una procedura. Quello che mi piace della tua dichiarazione finale è che può essere prontamente rifuso in una forma del genere, come in "Non hai più torto a scommettere con probabilità 95: 5 che il tuo intervallo di confidenza al 95% ha coperto la vera media, di quanto tu sia scommettere sul lancio della moneta del tuo amico con probabilità 50:50 ".
whuber

OK, l'ho cambiato.
nigelhenry,

2

Supponiamo che l'elemento della configurazione calcolato dalla particolare serie di dati in possesso sia uno del 5% dei possibili elementi della configurazione che non contiene la media. Quanto è vicino l'intervallo del 95% credibile che vorresti immaginare? (Cioè, quanto è vicino a contenere la media con una probabilità del 95%?) Non hai la certezza che sia vicino. In effetti, il tuo elemento della configurazione potrebbe non sovrapporsi con nemmeno uno dei 95% degli IC del 95% che contenga effettivamente la media. Per non parlare del fatto che non contiene la media stessa, il che suggerisce anche che non è un intervallo credibile del 95%.

Forse vuoi ignorarlo e presumere ottimisticamente che il tuo elemento della configurazione sia uno del 95% che contiene la media. OK, cosa sappiamo del tuo elemento della configurazione, dato che è nel 95%? Che contiene la media, ma forse solo una via d'uscita all'estremo, escludendo tutto il resto dall'altra parte della media. È improbabile che contenga il 95% della distribuzione.

Ad ogni modo, non c'è garanzia, forse nemmeno una ragionevole speranza che il tuo IC al 95% sia un intervallo credibile al 95%.


Sono curioso di sapere il primo paragrafo. Forse sto leggendo male, ma l'argomento sembra un po 'in contrasto con il fatto che ci sono più esempi in cui gli EC e gli intervalli credibili coincidono per tutte le possibili serie di osservazioni. Cosa mi sono perso?
cardinale il

@cardinale: potrei sbagliarmi. Stavo parlando del caso generale, ma la mia ipotesi sarebbe che nel caso in cui CI e intervallo credibile siano gli stessi, ci sono altre restrizioni come la normalità che impediscono agli CI di essere troppo lontani.
Wayne,

Il mio focus è stato fortemente attratto dall'ultima frase del paragrafo; l'esempio di intervalli coincidenti aveva lo scopo di evidenziare un punto. Potresti considerare se credi davvero o meno a quella frase. :)
cardinale il

Vuoi dire che un IC al 95% non implica che il 5% non includa la media? Dovrei dire "per definizione, non è nemmeno necessario contenere la media stessa"? O mi sto perdendo ancora di più?
Wayne,

Wayne, in che modo il fatto che un determinato intervallo non contenga la media gli impedisce di essere un intervallo credibile valido? Sto leggendo male questa osservazione?
cardinale il

2

(vale a dire che un amico lancia una moneta giusta, nasconde il risultato e non posso dire che c'è una probabilità del 50% che sia la testa)

Se stai solo indovinando i tuoi amici a lanciare monete con il 50% di testa / croce, allora non lo stai facendo bene.

  • Dovresti provare a guardare rapidamente la moneta dopo / quando atterra e prima che il risultato sia nascosto.
  • Inoltre, dovresti provare a creare in anticipo una stima a priori dell'equità della moneta.

Sicuramente la credibilità della tua ipotesi sul lancio della moneta dipenderà da queste condizioni e non sarà sempre lo stesso 50% (a volte il tuo metodo di "barare" potrebbe funzionare meglio).

La tua ipotesi generale potrebbe essere, se imbroglia, x> 50% delle volte giuste, ma ciò non significa necessariamente che la probabilità per ogni lancio particolare fosse costantemente x% di teste. Quindi sarebbe un po 'strano proiettare la tua probabilità complessiva sulla probabilità per un tiro specifico. È un "tipo di probabilità" diverso.


Dipende da quale livello o profondità specifichi / definisci "probabilità" .

  • La fiducia è indipendente dalla "probabilità specifica nel particolare esperimento / capovolgimento" e indipendente dalle "probabilità a priori" .

  • La fiducia riguarda l' insieme di esperimenti . È costruito in modo tale che non è necessario conoscere le probabilità o le distribuzioni a priori nella popolazione.

  • La confidenza è circa il "tasso di fallimento" complessivo della stima, ma per casi specifici si potrebbe essere in grado di specificare più precisamente le variazioni di probabilità .

    ( Queste variazioni di probabilità esistono almeno implicitamente , in teoria, e non abbiamo bisogno di conoscerle perché esistano. Ma possiamo esprimere esplicitamente queste probabilità usando un approccio bayesiano).


Esempio 1:

Supponiamo che tu stia testando una malattia molto rara. Esegui un test che potrebbe essere visto come una prova di Bernoulli (positiva o negativa) che ha un alto per esito positivo quando la persona è malata o basso quando la persona non è malata.p=0.99p=0.01

Ora questo non viene in genere fatto (nella pratica clinica) per stimare un intervallo CI per ma è possibile farlo (come esempio) se lo si desidera. Se il test è positivo, si stima e se il test è negativo, si stima .p0.05p10p0.95

Se hai l'1% della popolazione malata, in media otterrai l'1,98% del test positivo (1% da 99% di persone sane risulta positivo e il 99% da 1% di persone malate positive). Questo rende il tuo intervallo IC al 95% (condizionato) quando incontri un test positivo , correggendo solo il 50% delle volte.

D'altra parte, quando si incontra un test negativo, sarà più del 95% delle volte corretto, quindi nel complesso la stima dell'intervallo CI è corretta (almeno) il 95% delle volte, ma caso per caso (per casi specifici ) non puoi davvero dire che la probabilità di all'interno dell'intervallo sia del 95%. C'è probabilmente qualche variazione.p

Esempio 2:

Supponiamo che le persone eseguano 300 domande sul QI. Dal naïve intervallo di confidenza e dal punto di vista del frequentista, si potrebbe presumere che ogni persona abbia una distribuzione teorica personale per le prestazioni dei test e, sulla base delle prestazioni dei test osservati, è possibile creare una stima per un intervallo tale che nel 95% dei casi avrai ragione a contenere correttamente nell'intervallo.iN(μi,σi2)μi

Ciò ignora che esiste un effetto di regressione sulla media e che la probabilità a priori per il QI qualsiasi persona è distribuita come . Quindi in casi estremi, basso o alto, risultato dei risultati, la probabilità del QI di una persona negli intervalli di confidenza del 95% basati su misurazioni / test sarà inferiore al 95%.μiN(100,15)

(è vero il contrario per le persone che hanno risultati vicini a 100, il loro QI sarà probabilmente più probabile del 95% all'interno dell'IC al 95%, e questo dovrebbe compensare gli errori che hai commesso agli estremi in modo da finire per avere ragione nel 95% dei casi)


2

Innanzitutto, diamo una definizione dell'intervallo di confidenza o, in spazi di dimensione maggiori di uno, la regione di confidenza. La definizione è una versione sintetica di quella data da Jerzy Neyman nel suo articolo del 1937 alla Royal Society.

Lascia che il parametro sia e che la statistica sia . Ogni possibile valore di parametro è associato a una regione di accettazione per la quale , con come coefficiente di confidenza, o livello di confidenza (in genere 0,95), e sono le informazioni di base che dobbiamo definire le nostre probabilità . La regione di confidenza per , dato , è quindi .pspA(p,α)prob(sA(p,α)|p=p,I)=ααIps=sC(s,α)={p|sA(p,α)}

In altre parole, i valori dei parametri che formano la regione di confidenza sono solo quelli la cui corrispondente regione di -probability dello spazio campione contiene la statistica.α

Consideriamo ora che per ogni possibile valore del parametro :p

[pC(s,α)]prob(s=s|p=p,I)ds=[sA(p,α)]prob(s=s|p=p,I)ds=α

dove le parentesi quadre sono parentesi Iverson. Questo è il risultato chiave per un intervallo o una regione di confidenza. Dice che l'aspettativa di , sotto la distribuzione campionaria condizionata a , è . Questo risultato è garantito dalla costruzione delle regioni di accettazione e inoltre si applica a , poiché è un possibile valore di parametro. Tuttavia, non è una dichiarazione di probabilità su , perché le aspettative non sono probabilità![pC(s,α)]pαppp

La probabilità per cui questa aspettativa viene comunemente scambiata è la probabilità, subordinata a , che il parametro risieda nella regione di confidenza:s=s

prob(pC(s,α)|s=s,I)=C(s,α)prob(s=s|p=p,I)prob(p=p|I)dpprob(s=s|p=p,I)prob(p=p|I)dp

Questa probabilità si riduce a solo per determinate combinazioni di informazioni e regioni di accettazione . Ad esempio, se il precedente è uniforme e la distribuzione di campionamento è simmetrica in e (ad esempio un gaussiano con come media), allora:αIA(p,α)spp

prob(pC(s,α)|s=s,I)=C(s,α)prob(s=p|p=s,I)dpprob(s=p|p=s,I)dp=prob(sC(s,α)|p=s,I)=prob(sA(s,α)|p=s,I)

Se inoltre le regioni di accettazione sono tali che , allora:sA(s,α)sA(s,α)

prob(pC(s,α)|s=s,I)=prob(sA(s,α)|p=s,I)=α

L'esempio del manuale di stima di una media della popolazione con un intervallo di confidenza standard costruito attorno a una statistica normale è un caso speciale delle assunzioni precedenti. Pertanto, il 95% intervallo di confidenza di serie fa contenere la media con probabilità 0,95; ma questa corrispondenza generalmente non vale.


-1

Ci sono alcune risposte interessanti qui, ma ho pensato di aggiungere una piccola dimostrazione pratica usando R. Abbiamo recentemente usato questo codice in un corso di statistica per evidenziare come funzionano gli intervalli di confidenza. Ecco cosa fa il codice:

1 - Campiona da una distribuzione nota (n = 1000)

2 - Calcola l'IC 95% per la media di ciascun campione

3 - Chiede se l'IC di ciascun campione include o meno la media vera.

4 - Riporta nella console la frazione di EC che includeva la media vera.

Ho appena eseguito la sceneggiatura un sacco di volte e in realtà non è insolito scoprire che meno del 94% degli EC conteneva la vera media. Almeno per me, questo aiuta a dissipare l'idea che un intervallo di confidenza ha una probabilità del 95% di contenere il parametro vero.

#   In the following code, we simulate the process of
#   sampling from a distribution and calculating
#   a confidence interval for the mean of that 
#   distribution.  How often do the confidence
#   intervals actually include the mean? Let's see!
#
#   You can change the number of replicates in the
#   first line to change the number of times the 
#   loop is run (and the number of confidence intervals
#   that you simulate).
#
#   The results from each simulation are saved to a
#   data frame.  In the data frame, each row represents
#   the results from one simulation or replicate of the 
#   loop.  There are three columns in the data frame, 
#   one which lists the lower confidence limits, one with
#   the higher confidence limits, and a third column, which
#   I called "Valid" which is either TRUE or FALSE
#   depending on whether or not that simulated confidence
#   interval includes the true mean of the distribution.
#
#   To see the results of the simulation, run the whole
#   code at once, from "start" to "finish" and look in the
#   console to find the answer to the question.    

#   "start"

replicates <- 1000

conf.int.low <- rep(NA, replicates)
conf.int.high <- rep(NA, replicates)
conf.int.check <- rep(NA, replicates)

for (i in 1:replicates) {

        n <- 10
        mu <- 70
        variance <- 25
        sigma <- sqrt(variance)
        sample <- rnorm(n, mu, sigma)
        se.mean <- sigma/sqrt(n)
        sample.avg <- mean(sample)
        prob <- 0.95
        alpha <- 1-prob
        q.alpha <- qnorm(1-alpha/2)
        low.95 <- sample.avg - q.alpha*se.mean
        high.95 <- sample.avg + q.alpha*se.mean

        conf.int.low[i] <- low.95
        conf.int.high[i] <- high.95
        conf.int.check[i] <- low.95 < mu & mu < high.95
 }    

# Collect the intervals in a data frame
ci.dataframe <- data.frame(
        LowerCI=conf.int.low,
        UpperCI=conf.int.high, 
        Valid=conf.int.check
        )

# Take a peak at the top of the data frame
head(ci.dataframe)

# What fraction of the intervals included the true mean?
ci.fraction <- length(which(conf.int.check, useNames=TRUE))/replicates
ci.fraction

    #   "finish"

Spero che sia di aiuto!


2
Mi scuso per le critiche, ma ho dovuto (temporaneamente) sottovalutare questa risposta. Credo che stia fraintendendo il significato di un intervallo di confidenza e spero sinceramente che questo non sia l'argomento usato nella tua classe. Le simulazioni si riducono a un esperimento di campionamento binomiale (abbastanza elaborato).
cardinale il

5
@cardinal Beh ... sta solo usando l'interpretazione a lungo termine delle statistiche dei frequentisti. Campione dalla popolazione molte volte, calcola l'IC più volte e scopri che la media vera è contenuta nell'IC 95% delle volte (per ). Almeno questo mi era abbastanza chiaro. 1α=0.95
Néstor,

4
"Meno del 94%" in un campione di 1000 IC non è sicuramente una prova significativa contro l'idea che il 95% di EC contenga la media. In effetti, mi aspetto che il 95% degli EC contenga effettivamente la media, in questo caso.
Ronald,

3
@Ronald: Sì, questo era esattamente il mio punto con i commenti, ma l'hai detto in modo molto più semplice e conciso. Grazie. Come affermato in uno dei commenti, si vedranno 940 successi o meno circa l' 8,7% delle volte e questo è vero per qualsiasi IC esattamente al 95% che si costruisce nel corso di 1000 esperimenti. :)
cardinale il

2
@JamesWaters: grazie per aver dedicato del tempo per rispondere. Il codice va bene, ma non vedo come "dimostra i casi in cui non è corretto". Puoi spiegare questo intento? Sospetto ancora che qui possa esserci un malinteso fondamentale. Sembra che tu capisca cos'è l'IIC e come interpretarlo correttamente, ma l'esperimento di simulazione non risponde alla domanda a cui sembra affermare che risponda. Penso che questa risposta abbia un potenziale, quindi mi piacerebbe vederla finire con una bella modifica per chiarire il punto che stai cercando di ottenere. Saluti. :)
cardinale il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.