Stimatore James-Stein con varianze ineguali


11

Ogni affermazione che trovo dello stimatore di James-Stein presuppone che le variabili casuali stimate abbiano la stessa (e unità) varianza.

Ma tutti questi esempi menzionano anche che lo stimatore JS può essere usato per stimare quantità senza nulla a che fare l'una con l'altra. L' esempio di Wikipedia è la velocità della luce, il consumo di tè a Taiwan e il peso del maiale nel Montana. Ma presumibilmente le tue misurazioni su queste tre quantità avrebbero varianze "vere" diverse. Questo presenta un problema?

Ciò si lega a un problema concettuale più ampio che non capisco, correlato a questa domanda: Stimatore James-Stein: In che modo Efron e Morris hanno calcolato nel fattore di restringimento per il loro esempio di baseball? σ2Calcoliamo il fattore di restringimento come segue:c

c=1(k3)σ2(yy¯)2

Intuitivamente, penso che il termine sia in realtà - diverso per ogni quantità stimata. Ma la discussione in quella domanda parla solo dell'uso della varianza aggregata ...σ2σi2

Gradirei davvero se qualcuno potesse chiarire questa confusione!


3
Se la varianza è possiamo semplicemente moltiplicare a sinistra per per tornare al problema di James-Stein. Se è sconosciuto, ma ogni "osservazione" nel problema è una media campionaria calcolata sulla base delle osservazioni , possiamo stimare con qualche e sperare di ottenere anche una situazione di James-Stein se pre-moltiplichiamo per invece. D=diag(σ12,,σn2)D1/2DmiDD^D^1/2
ragazzo,

2
@guy: questo è un suggerimento ragionevole (+1), tuttavia ciò comporterà lo stesso fattore di restringimento per tutte le variabili, mentre si vorrebbe ridurre le variabili in modo diverso, a seconda della loro varianza / incertezza. Vedi la risposta che ho appena pubblicato.
ameba dice Ripristina Monica il

1
@amoeba Certo; Non stavo suggerendo che il mio stimatore fosse pratico, solo che illustrava il motivo per cui la gente dice le cose che OP ha menzionato nel suo secondo paragrafo.
ragazzo

Risposte:


6

A questa domanda fu esplicitamente risposto nella serie classica di articoli sullo stimatore di James-Stein nel contesto di Empirical Bayes scritto negli anni '70 da Efron & Morris. Mi riferisco principalmente a:

  1. Efron e Morris, 1973, la regola di stima di Stein e i suoi concorrenti: un approccio empirico a Bayes

  2. Efron e Morris, 1975, Analisi dei dati con lo stimatore di Stein e le sue generalizzazioni

  3. Efron e Morris, 1977, Stein's Paradox in Statistics

Il documento del 1977 è un'esposizione non tecnica da leggere. Lì introducono l'esempio dell'ovatta da baseball (che è discusso nel thread a cui sei collegato); in questo esempio si suppone che le varianze di osservazione siano uguali per tutte le variabili e il fattore di contrazione sia costante.c

Tuttavia, continuano a dare un altro esempio, che sta valutando i tassi di toxoplasmosi in un certo numero di città in El Salvador. In ogni città è stato esaminato un numero diverso di persone, quindi si può pensare che le singole osservazioni (tasso di toxoplasmosi in ciascuna città) abbiano varianze diverse (più basso è il numero di persone intervistate, maggiore è la varianza). L'intuizione è certamente che i punti dati con bassa varianza (bassa incertezza) non devono necessariamente essere ridotti tanto quanto i punti dati con elevata varianza (alta incertezza). Il risultato della loro analisi è mostrato nella figura seguente, dove si può effettivamente vedere che ciò sta accadendo:

inserisci qui la descrizione dell'immagine

Gli stessi dati e analisi sono presentati anche nel documento molto più tecnico del 1975, in una figura molto più elegante (purtroppo non mostra le singole varianze), vedere la Sezione 3:

inserisci qui la descrizione dell'immagine

Lì presentano un trattamento Empirical Bayes semplificato che procede come segue. Lascia che dove è sconosciuta. Nel caso in cui tutti i siano identici, il trattamento standard di Empirical Bayes consiste nel stimare come e calcolare la media a posteriori di come che è nulla altro che lo stimatore di James-Stein.

Xi|θiN(θi,Di)θiN(0,A)
ADi=11/(1+A)(k2)/Xj2θi
θ^i=(111+A)Xi=(1k2Xj2)Xi,

Se ora , la regola di aggiornamento di Bayes è e possiamo usare lo stesso trucco di Bayes empirico per stimare , anche se in questo caso non esiste una formula chiusa per (vedere il documento). Tuttavia, lo notanoDi1

θ^i=(1DiDi+A)Xi
AA^

... questa regola non si riduce a quella di Stein quando tutti sono uguali, e invece usiamo una variante minore di questo stimatore derivata [nel documento del 1973] che si riduce a quella di Stein. La regola della variante stima un valore diverso per ogni città. La differenza tra le regole è minore in questo caso, ma potrebbe essere importante se fosse più piccolo.DjA^ik

La sezione pertinente nel documento del 1973 è la Sezione 8, ed è un po 'più difficile da leggere. È interessante notare che hanno un commento esplicito lì sul suggerimento fatto da @guy nei commenti sopra:

Un modo molto semplice per generalizzare la regola di James-Stein per questa situazione è definire , in modo che , applica [la regola originale di James-Stein] ai dati trasformati, quindi torna alle coordinate originali. La regola risultante stima di Ciò non è attraente poiché ogni è ridotto verso l'origine dallo stesso fattore.x~i=Di1/2xi,θ~i=Di1/2θix~iN(θ~i,1)θi

θ^i=(1k2[Xj2/Dj])Xi.
Xi

Quindi continuano e descrivono la loro procedura preferita per stimare che devo confessare di non aver letto completamente (è un po 'coinvolto). Ti suggerisco di guardare lì se sei interessato ai dettagli.A^i

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.