Come si spiega che cosa è uno stimatore imparziale per un laico?


10

Supponiamo che sia uno stimatore imparziale per . Quindi, naturalmente, . θE[ θ |θ]=θθ^θE[θ^θ]=θ

Come si spiega questo a un laico? In passato, ciò che ho detto è se in media un sacco di valori di , quando la dimensione del campione aumenta, si ottiene una migliore approssimazione di . θθ^θ

Per me questo è problematico. Penso che ciò che sto effettivamente descrivendo qui sia questo fenomeno di essere asintoticamente imparziali, piuttosto che essere solo imparziali, cioè dove \ hat {\ theta} dipende probabilmente da n .

limnE[θ^θ]=θ,
θ^n

Quindi, come si spiega che cosa è uno stimatore imparziale per un laico?


2
È un modo di fare una stima che è quasi giusta: di solito non è esattamente giusto ma nel complesso non produce sopravvalutazioni più spesso di sottostimate. Mi rendo conto che questo fa sembrare più simile a θ la mediana di θ^ che la media, ma penso che catturi il punto essenziale.
jwimberley,

3
Mi piace la battuta "caccia a tre statisti" (una versione qui ) per questo ...
Ben Bolker,

2
La tua spiegazione è la legge dei grandi numeri, non ha nulla a che fare con l'imparzialità.
Xi'an,

@ Xi'an: se lo stimatore fosse distorto, il limite non sarebbe . θ
user2357112 supporta Monica il

@utente2357112: secondo la mia comprensione (e di altri, come mostrato dalle risposte finora), poiché la dimensione del campione aumenta significa considerare come cresce all'infinito, cioè uno stimatore basato su osservazioni. Ora vedo che la frase può essere interpretata in modo diverso. θ^nnn
Xi'an,

Risposte:


14

Tecnicamente quello che stai descrivendo quando dici che il tuo stimatore si avvicina al vero valore man mano che la dimensione del campione aumenta è (come altri hanno già detto) coerenza o convergenza di stimatori statistici. Questa convergenza può essere una convergenza in probabilità, che dice che per ogni , o quasi convergenza sicura che dice che . Nota come il limite è effettivamente dentrolimnP(|θ^nθ|>ϵ)=0ϵ>0P(limn|θ^nθ|>ϵ)=0la probabilità nel secondo caso. Si scopre che quest'ultima forma di convergenza è più forte dell'altra, ma entrambe significano essenzialmente la stessa cosa, che è che la stima tende ad avvicinarsi sempre più a ciò che stiamo stimando man mano che raccogliamo più campioni.

Un punto sottile, qui è che anche quando sia in probabilità o quasi sicuramente, è non è vero in generale che , quindi la coerenza non implica imparzialità asintotica come stai suggerendo. Devi stare attento quando ti muovi tra sequenze di variabili casuali (che sono funzioni) a sequenze di aspettative (che sono integrali).θ^nθlimnE(θ^n)=θ

A parte tutto il materiale tecnico, imparziale significa solo che . Quindi, quando lo spieghi a qualcuno, dici semplicemente che se l'esperimento fosse ripetuto in condizioni identiche molte volte, il valore medio della stima sarebbe vicino al valore reale.E(θ^n)=θ


5
La tua visione del laico è abbastanza ammirevole. Sa cos'è "convergenza in probabilità", "come convergenza", limiti ... È l'uomo del futuro.
Aksakal,

2
Non credo che un laico conosca nessuna di queste cose, stavo cercando di correggere alcuni malintesi nel post originale. Il mio suggerimento su come spiegare le cose a un laico è nell'ultimo paragrafo.
dsaxton,

quest'ultimo paragrafo, tuttavia, intreccia il concetto di pregiudizio con la coerenza di uno stimatore, che probabilmente era una delle confusioni di OP all'inizio.
Aksakal,

3
Come mai? Ripetere un esperimento in condizioni identiche significherebbe che la dimensione del campione è fissa, quindi ovviamente non stiamo parlando di coerenza.
dsaxton,

1
Ok, hai ragione, ma significa che stai portando in visione frequentista di una probabilità
Aksakal,

9

Non sono sicuro se confondi coerenza e imparzialità.

Coerenza: maggiore è la dimensione del campione, minore è la varianza dello stimatore.

  • Dipende dalla dimensione del campione

Impedenza: il valore atteso dello stimatore è uguale al valore reale dei parametri

  • Non dipende dalla dimensione del campione

Quindi la tua frase

se si calcola la media di un sacco di valori di , man mano che la dimensione del campione aumenta, si ottiene una migliore approssimazione di .θ^θ

Non è corretto. Anche se la dimensione del campione diventa infinita, uno stimatore imparziale rimarrà uno stimatore imparziale, ad es. Se si stima la media come "media +1", è possibile aggiungere un miliardo di osservazioni al campione e lo stimatore non fornirà comunque il valore reale.

Qui puoi trovare una discussione più profonda sulla differenza tra coerenza e imparzialità.

Qual è la differenza tra uno stimatore coerente e uno stimatore imparziale?


2
In realtà non so nulla di coerenza, ma grazie comunque.
Clarinetist,

1
La coerenza di @Clarinetist è forse la proprietà più importante di uno stimatore, che con dati sufficienti, ti avvicinerai arbitrariamente alla risposta giusta.
Matthew Gunn,

7

@Ferdi ha già fornito una risposta chiara alla tua domanda, ma rendiamola un po 'più formale.

Lasciate essere il vostro campione di variabili casuali indipendenti e identicamente distribuite da distribuzione . Sei interessato a stimare la quantità sconosciuta ma fissa , usando lo stimatore in funzione di . Poiché è una funzione di variabili casuali, stimareX1,,XnFθ gX1,,Xng

θ^n=g(X1,,Xn)

è anche una variabile casuale. Definiamo pregiudizio come

bias(θ^n)=Eθ(θ^n)θ

lo stimatore è imparziale quando .Eθ(θ^n)=θ

Dicendolo in parole povere: abbiamo a che fare con variabili casuali , quindi a meno che non sia degenerato , se prendessimo campioni diversi, potremmo aspettarci di osservare dati diversi e stime così diverse. Tuttavia, potremmo aspettarci che su diversi campioni "in media" stimati sarebbe "giusto" se lo stimatore è imparziale. Quindi non sarebbe sempre giusto, ma "in media" sarebbe giusto. Semplicemente non può sempre essere "giusto" a causa della casualità associata ai dati.θ^n

Come altri hanno già notato, il fatto che la stima si "avvicini" alla quantità stimata man mano che il campione cresce, vale a dire che converge in probabilità

θ^nPθ

ha a che fare con la coerenza degli stimatori , non con imparzialità. La sola imparzialità non ci dice nulla sulla dimensione del campione e sulla sua relazione con le stime ottenute. Inoltre, gli stimatori imparziali non sono sempre disponibili e non sempre preferibili a quelli distorti. Ad esempio, dopo aver considerato il compromesso della variazione di bias potresti essere disposto a prendere in considerazione l'uso dello stimatore con una maggiore propensione, ma una varianza minore - quindi "in media" sarebbe più lontano dal valore reale, ma più spesso (varianza più piccola) le stime sarebbero essere più vicini al valore reale, quindi in caso di stimatore imparziale.


(+1): ottimo punto per introdurre il fatto che raramente sono disponibili stime imparziali. E menzionando l'opposizione di polarizzazione / varianza.
Xi'an,

2

Per prima cosa devi distinguere il pregiudizio incomprensivo dal pregiudizio statistico, specialmente per un laico.

La scelta di dire usando la mediana, la media o la modalità come stimatore per una media della popolazione , spesso contiene un pregiudizio politico, religioso o di teoria scientifica. Il calcolo su quale stimatore è la migliore forma di media è di un tipo diverso dall'aritmetica che influenza la distorsione statistica.

Una volta superato il bias di selezione del metodo, è possibile affrontare i bias potenziali nel metodo di stima. Per prima cosa devi scegliere un metodo che può avere un pregiudizio e un meccanismo che porta facilmente a quel pregiudizio.

Può essere più semplice utilizzare una divisione di un punto di vista conquistatore in cui diventa evidente quando le dimensioni del campione diminuiscono, la stima diventa chiaramente distorta. Ad esempio, il fattore n-1 (rispetto al fattore 'n') negli stimatori della diffusione del campione diventa evidente quando n scende da 3 a 2 a 1!

Tutto dipende da quanto "laica" è la persona.


Temo che tu possa parlare di diversi tipi di pregiudizi rispetto a quello in questione. Potresti provare ad essere più specifico su cosa sia il pregiudizio? Scrivi "potenziali distorsioni nel metodo di stima" e questo non sembra corrispondere alla definizione di distorsione (fornita nella domanda e risposte sopra). Alla fine, questo rende la tua risposta confusa ...
Tim

@Tim, il primo passo è stato quello di garantire che i pregiudizi umani fossero stati coperti. Il secondo passo è stato (e in parte segue le questioni del passaggio 1) per assicurarsi che l'insegnamento del laico non fosse già quel metodo X (quello imparziale) che doveva essere scelto. es. La deviazione standard è 1 / n * sum ((x-mean) ^ 2), ma ciò (attentamente) non distingue tra popolazione e campione. Alla maggior parte dei "laici" viene insegnata la versione 1 / (N-1) non pensante per un campione. Se hai un solo metodo, tu (il laico) non hai altra scelta da fare, quindi il pregiudizio dello stimatore non può essere un problema ... È il passo Kruger-Dunning.
Philip Oakley,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.