Miglioramento dello stimatore minimo


9

Supponiamo che io abbia parametri positivi per stimare e le corrispondenti stime stimate prodotte dagli stimatori , ovvero , e così via.nμ1,μ2,...,μnnμ1^,μ2^,...,μn^E[μ1^]=μ1E[μ2^]=μ2

Vorrei stimare min(μ1,μ2,...,μn) usando le stime a portata di mano. Chiaramente lo stimatore ingenuo min(μ1^,μ2^,...,μn^) è di parte inferiore come

E[min(μ1^,μ2^,...,μn^)]min(μ1,μ2,...,μn)

Supponiamo di avere anche la matrice di covarianza degli stimatori corrispondenti Cov(μ1^,μ2^,...,μn^)=Σ . È possibile ottenere una stima imparziale (o meno distorta) del minimo utilizzando le stime fornite e la matrice di covarianza?


Sei disposto a utilizzare l'approccio Bayesian MCMC o hai bisogno di una formula a forma chiusa?
Martin Modrák,

Ma un semplice approccio di campionamento è OK? (inoltre, non è strettamente necessario priori per l'analisi bayesiana, ma questa è un'altra storia)
Martin Modrák,

@ MartinModrák Non ho esperienza con gli approcci di campionamento. Se faccio bayesiano di solito faccio semplici cose coniugate. Ma se pensi che questa sia la strada da percorrere, andrò avanti e imparerò.
Cagdas Ozgenc,

Cos'altro sai di queste stime? Conosci le espressioni? Conosci la distribuzione dei dati utilizzati per stimare questi parametri?
wij,

@wij Posso provare a stimare altri momenti degli stimatori, se necessario. Non ho un'espressione analitica per la distribuzione degli stimatori. La soluzione non dovrebbe dipendere (come mio requisito) dalla distribuzione dei dati stessi.
Cagdas Ozgenc,

Risposte:


4

Non ho una risposta chiara sull'esistenza di uno stimatore imparziale. Tuttavia, in termini di errore di stima, stimare è un problema intrinsecamente difficile in generale.min(μ1,,μn)

Ad esempio, lascia e . Sia la quantità target e è una stima di . Se utilizziamo lo stimatore "ingenuo" dove , quindi, l' errore di stima è limitato da fino a costante. (Notare che l'errore di stima per ogni è ). Certo, seμ = ( μ 1 , ... , μ n ) θ = min i μ i θY1,,YNN(μ,σ2I)μ=(μ1,,μn)θ=miniμiθ^θ = min i ( ˉ Y i ) ¯ Y i = 1θθ^=mini(Y¯i)Yi¯=1Nj=1NYi,jL2

E[θ^θ]2σ2lognN
σ 2μi μiσσ2σ2Nμisono molto distanti tra loro e è molto piccolo, l'errore di stima dovrebbe essere ridotto a . Tuttavia, nel peggiore dei casi, non esiste una stima di meglio dello stimatore ingenuo. Puoi mostrare con precisione che dove l'infimo prende il sopravvento su tutto il possibile estremo di basato sul campione e il supremum prende in carico tutta la possibile configurazione di 's.σ θinf θ sup μ 1 ,..., μ n E[ θ -θ]2σ2lognσ2Nθ θY1,,YNμi
infθ^supμ1,,μnE[θ^θ]2σ2lognN
θY1,,YNμi

Pertanto lo stimatore ingenuo è minimox ottimale fino a costante, e non esiste una stima migliore di in questo senso.θ


Le informazioni aggiuntive fornite non aiutano affatto? Quali statistiche aggiuntive possono essere utili?
Cagdas Ozgenc,

Ci scusiamo per aver fatto un punto confuso. Non intendevo che le informazioni aggiuntive (covarianza) non fossero utili. Volevo solo sottolineare che stimare il minimo di diversi mezzi della popolazione è di natura difficile. Le informazioni sulla covarianza dovrebbero essere utili. Ad esempio, nel caso normale, se abbiamo correlazioni perfette per tutte le possibili coppie, significa che le osservazioni casuali provengono da una media diversa + un termine di rumore comune. In questo caso, lo stimatore ingenuo (minimo delle medie campionarie) è imparziale.
JaeHyeok Shin,

3

EDIT: Quanto segue risponde a una domanda diversa da quella che è stata posta - è inquadrata come se fosse considerato casuale, ma non funziona quando è considerato fisso, il che è probabilmente ciò che l'OP aveva in mente. Se è corretto, non ho una risposta migliore diμ μ min ( μ 1 , . . . , μ n )μμμmin(μ^1,...,μ^n)


Se consideriamo solo le stime per media e covarianza, possiamo trattare come un singolo campione dalla distribuzione normale multivariata. Un modo semplice per ottenere una stima del minimo è quindi disegnare un gran numero di campioni da , calcolare il minimo di ciascun campione e quindi prendere la media di quei minimi.M V N ( μ , Σ )(μ1,...,μn)MVN(μ^,Σ)

La procedura sopra descritta e i suoi limiti possono essere compresi in termini bayesiani - prendendo la notazione da Wikipedia su MVN , se è la covarianza nota degli stimatori e abbiamo un'osservazione, la distribuzione posteriore congiunta è dove e derivano dal precedente dove, prima di osservare qualsiasi dato prendiamo il precedente ). Dal momento che probabilmente non sei disposto a mettere i priori su , possiamo prendere il limite come , risultando in precedenza piatta e il posteriore diventaμ ~ M V N ( μ + m λ 0Σλ0mμ~MVN(λ0,m-1Σμm0μ~MVN( μ ,Σ)μμMVN(μ^+mλ01+m,1n+mΣ)λ0mμMVN(λ0,m1Σμm0μMVN(μ^,Σ). Tuttavia, dato il precedente piatto, stiamo implicitamente assumendo che gli elementi di differiscano molto (se tutti i numeri reali sono ugualmente probabili, è molto improbabile ottenere valori simili).μ

Una rapida simulazione mostra che la stima con questa procedura sovrastima leggermente quando gli elementi di differiscono molto e sottostima quando gli elementi sono simili. Si potrebbe sostenere che senza alcuna conoscenza preliminare si tratta di un comportamento corretto. Se sei disposto a dichiarare almeno alcune informazioni precedenti (ad es. ), i risultati potrebbero diventare un po 'meglio comportati per il tuo caso d'uso.μ m i n ( μ ) m = 0.1min(μ)μmin(μ)m=0.1

Se sei disposto ad assumere più struttura, potresti essere in grado di scegliere una distribuzione migliore rispetto alla multivariete normale. Inoltre potrebbe avere senso usare Stan o altri campionatori MCMC per adattarsi in primo luogo alle stime di . Questo ti porterà una serie di campioni di che riflettono l'incertezza negli stessi stimatori, inclusa la loro struttura di covarianza (forse più ricca di ciò che MVN può fornire). Ancora una volta è possibile calcolare il minimo per ciascun campione per ottenere una distribuzione posteriore sui minimi e prendere la media di questa distribuzione se è necessaria una stima puntuale.( μ 1 , . . . , μ n )μ(μ1,...,μn)


Si noti che non sto cercando di stimare il minimo di N variabili casuali. Sto cercando di stimare il minimo di N parametri. Sembra che il tuo suggerimento sia una stima per mentre ho bisogno di una stima perE[min(μ1^,μ2^,...,μn^)]min(μ1,μ2,...,μn)
Cagdas Ozgenc

Ho provato a modificare la risposta per spiegare la logica, spero che mi aiuti.
Martin Modrák,

Quindi questo metodo di campionamento produce risultati migliori rispetto al semplice stimatore , che funziona bene anche quando è lontano a parte e sottovaluta quando sono vicini. Perché sia ​​utile dovrebbe funzionare quando sono vicini. min(μ1^,μ2^,...,μn^)μi
Cagdas Ozgenc,

Nota inoltre che tutti i sono numeri positivi, quindi non hai davvero bisogno della parte negativa della linea reale. μi
Cagdas Ozgenc,

1
Hai ragione sul fatto che ignoro i segni e non vedo un modo semplice per accoglierli. Anche lo stimatore che ho proposto funziona meglio quando è considerato casuale, ma è peggio di per fisso . Non credo di poterlo salvare e non sono sicuro di quale sia la strada migliore da seguire - sono propenso a provare a cancellare la risposta in quanto non risponde realmente alla domanda, ma (spero) la risposta contenga anche alcune idee che potrebbe essere utile a qualcuno. m i n ( μ ) μμmin(μ^)μ
Martin Modrák,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.