Valore atteso della statistica minima dell'ordine da un campione normale


9

AGGIORNAMENTO 25 gennaio 2014: l'errore è ora corretto. Ignora i valori calcolati del Valore atteso nell'immagine caricata - sono errati - Non elimino l'immagine perché ha generato una risposta a questa domanda.

AGGIORNAMENTO 10 gennaio 2014: l'errore è stato trovato: un errore di matematica in una delle fonti utilizzate. Preparazione della correzione ...

La densità della statistica minima dell'ordine da una raccolta di iid variabili continue continue con cdf e pdf è F X ( x ) f X ( x ) f X ( 1 ) ( x ( 1 ) ) = n f X ( x ( 1 ) ) [ 1 - F X ( x ( 1 ) ) ] n - 1nFX(x)fX(x)

fX(1)(x(1))=nfX(x(1))[1FX(x(1))]n1[1]

Se queste variabili casuali sono normali normali, allora

fX(1)(x(1))=nϕ(x(1))[1Φ(x(1))]n1=nϕ(x(1))[Φ(x(1))]n1[2]
e quindi il suo valore atteso è
E(X(1))=nx(1)ϕ(x(1))[Φ(x(1))]n1dx(1)[3]

dove abbiamo usato le proprietà simmetriche della normale standard. In Owen 1980 , p.402, eq. [ N, 011 ] troviamo che

zϕ(z)[Φ(az)]mdz=am(a2+1)(2π)ϕ(z)[Φ(aza2+1)]m1dz[4]

Otteniamo i parametri corrispondenti tra eq [3] e [4] ( a=1 , m=n1 )

E(X(1))=n(n1)2πϕ(x(1))[Φ(x(1)2)]n2dx(1)[5]

Ancora una volta in Owen 1980, p. 409, eq [ n0,010,2 ] lo troviamo

[i=1mΦ(hidiz1di2)]ϕ(z)dz=Zm(h1,...,hm;{ρij})[6]

dove è la normale multivariata normale, sono i coefficienti di correlazione per coppia e .Zm()ρij=didj,ij1di1

Corrispondenza e abbiamo, , e [5][6]m=n2hi=0,i

di1di2=12di=±13iρij=ρ=1/3

Utilizzando questi risultati, eq diventa[5]

E(X(1))=n(n1)2πZn2(0,...,0;ρ=1/3)[7]

Questo integrale di probabilità normale standard multivariato di variabili equi-correlate, tutte valutate a zero , ha visto indagini sufficienti e sono stati derivati ​​vari modi per approssimarla e calcolarla. Una revisione approfondita (relativa al calcolo degli integrali di probabilità normale multivariata in generale) è Gupta (1963) . Gupta fornisce valori espliciti per vari coefficienti di correlazione e per un massimo di 12 variabili (quindi copre una raccolta di 14 variabili). I risultati sono (L'ULTIMA COLONNA È SBAGLIATA) :

inserisci qui la descrizione dell'immagine

Ora se rappresentiamo come il valore di cambia con , otterremoZn2(0,...,0;ρ=1/3)n

inserisci qui la descrizione dell'immagine

Quindi arrivo alle mie tre domande / richieste:
1) Qualcuno potrebbe verificare analiticamente e / o verificare mediante simulazione che i risultati per il valore atteso siano corretti (cioè verificare la validità di eq )?[7]

2) Supponendo che l'approccio sia corretto, qualcuno potrebbe fornire la soluzione per normali con varianza non zero e non unitaria? Con tutte le trasformazioni ho davvero le vertigini.

3) Il valore dell'integrale di probabilità sembra evolversi senza intoppi. Che ne dici di approssimarlo con qualche funzione di ?n

Risposte:


6

I risultati non appaiono corretti. Questo è facile da vedere, senza alcun calcolo, perché nella tua tabella, la tua aumenta con la dimensione del campione ; chiaramente, il valore atteso del minimo del campione deve ridursi (cioè diventare più negativo) man mano che la dimensione del campione aumenta.E[X(1)] nn

Il problema è concettualmente abbastanza semplice.

In breve: se ~ con pdf :XN(0,1)f(x)

inserisci qui la descrizione dell'immagine

... quindi il pdf della statistica del 1 ° ordine (in un campione di dimensione ) è:n

inserisci qui la descrizione dell'immagine

... ottenuto qui utilizzando la OrderStatfunzione in mathStatica, con dominio di supporto:

inserisci qui la descrizione dell'immagine

Quindi, , per può essere facilmente ottenuto esattamente come:E[X(1)]n=1,2,3

inserisci qui la descrizione dell'immagine

Il caso esatto è circa , che è ovviamente diverso dal tuo funzionamento di -1,06 (riga 1 della tabella), quindi sembra chiaro che qualcosa non vada nel tuo funzionamento (o forse la mia comprensione di ciò che stai cercando) .n=30.846284

Per , ottenere soluzioni in forma chiusa è più complicato, ma anche se l'integrazione simbolica risulta difficile, possiamo sempre usare l'integrazione numerica (se si desidera una precisione arbitraria). Questo è davvero molto semplice ... qui, ad esempio, è , per la dimensione del campione a 14, usando Mathematica :n4E[X(1)]n=1

 sol = Table[NIntegrate[x g, {x, -Infinity, Infinity}], {n, 1, 14}]

{0., -0.56419, -0.846284, -1.02938, -1.16296, -1.26721, -1.35218, -1.4236, -1.48501, -1.53875, -1.58644, -1.62923, -1.66799, -1.70338}

Tutto fatto. Questi valori sono ovviamente molto diversi da quelli nella tua tabella (colonna di destra).

Per considerare il caso più generale di un genitore , procedi esattamente come sopra, iniziando dal pdf normale generale.N(μ,σ2)


Grazie per la risposta. In effetti, ho anche notato che qualcosa non va nei risultati numerici: dopo tutto, il valore atteso dovrebbe aumentare in dimensioni assolute, anziché diminuire, man mano che aumenta. Ho lasciato la risposta così com'è, per vedere se potevo ottenere qualche intuizione da qualsiasi risposta. Sto ancora cercando a livello teorico dove si trova esattamente l'errore, il sospetto è la prima equazione che uso da Owen (perché la seconda è stata verificata da altre fonti) ... a proposito, potresti verificare se questa eq in il mio post (come trasformazione autonoma) è corretto? Sarei grato. 4n4
Alecos Papadopoulos,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.