A questa domanda fu esplicitamente risposto nella serie classica di articoli sullo stimatore di James-Stein nel contesto di Empirical Bayes scritto negli anni '70 da Efron & Morris. Mi riferisco principalmente a:
Efron e Morris, 1973, la regola di stima di Stein e i suoi concorrenti: un approccio empirico a Bayes
Efron e Morris, 1975, Analisi dei dati con lo stimatore di Stein e le sue generalizzazioni
Efron e Morris, 1977, Stein's Paradox in Statistics
Il documento del 1977 è un'esposizione non tecnica da leggere. Lì introducono l'esempio dell'ovatta da baseball (che è discusso nel thread a cui sei collegato); in questo esempio si suppone che le varianze di osservazione siano uguali per tutte le variabili e il fattore di contrazione sia costante.c
Tuttavia, continuano a dare un altro esempio, che sta valutando i tassi di toxoplasmosi in un certo numero di città in El Salvador. In ogni città è stato esaminato un numero diverso di persone, quindi si può pensare che le singole osservazioni (tasso di toxoplasmosi in ciascuna città) abbiano varianze diverse (più basso è il numero di persone intervistate, maggiore è la varianza). L'intuizione è certamente che i punti dati con bassa varianza (bassa incertezza) non devono necessariamente essere ridotti tanto quanto i punti dati con elevata varianza (alta incertezza). Il risultato della loro analisi è mostrato nella figura seguente, dove si può effettivamente vedere che ciò sta accadendo:
Gli stessi dati e analisi sono presentati anche nel documento molto più tecnico del 1975, in una figura molto più elegante (purtroppo non mostra le singole varianze), vedere la Sezione 3:
Lì presentano un trattamento Empirical Bayes semplificato che procede come segue. Lascia che dove è sconosciuta. Nel caso in cui tutti i siano identici, il trattamento standard di Empirical Bayes consiste nel stimare come e calcolare la media a posteriori di come che è nulla altro che lo stimatore di James-Stein.Xi|θi∼N(θi,Di)θi∼N(0,A)
ADi=11/(1+A)(k−2)/∑X2jθiθ^i=(1−11+A)Xi=(1−k−2∑X2j)Xi,
Se ora , la regola di aggiornamento di Bayes è e possiamo usare lo stesso trucco di Bayes empirico per stimare , anche se in questo caso non esiste una formula chiusa per (vedere il documento). Tuttavia, lo notanoDi≠1θ^i=(1−DiDi+A)Xi
AA^
... questa regola non si riduce a quella di Stein quando tutti sono uguali, e invece usiamo una variante minore di questo stimatore derivata [nel documento del 1973] che si riduce a quella di Stein. La regola della variante stima un valore diverso per ogni città. La differenza tra le regole è minore in questo caso, ma potrebbe essere importante se fosse più piccolo.DjA^ik
La sezione pertinente nel documento del 1973 è la Sezione 8, ed è un po 'più difficile da leggere. È interessante notare che hanno un commento esplicito lì sul suggerimento fatto da @guy nei commenti sopra:
Un modo molto semplice per generalizzare la regola di James-Stein per questa situazione è definire , in modo che , applica [la regola originale di James-Stein] ai dati trasformati, quindi torna alle coordinate originali. La regola risultante stima di
Ciò non è attraente poiché ogni è ridotto verso l'origine dallo stesso fattore.x~i=D−1/2ixi,θ~i=D−1/2iθix~i∼N(θ~i,1)θiθ^i=(1−k−2∑[X2j/Dj])Xi.
Xi
Quindi continuano e descrivono la loro procedura preferita per stimare che devo confessare di non aver letto completamente (è un po 'coinvolto). Ti suggerisco di guardare lì se sei interessato ai dettagli.A^i