Statistiche dell'ordine (ad es. Minimo) di raccolta infinita di variati chi-quadrati?


11

Questa è la mia prima volta qui, quindi per favore fatemi sapere se posso chiarire la mia domanda in qualsiasi modo (incl. Formattazione, tag, ecc.). (E spero di poterlo modificare in seguito!) Ho provato a trovare riferimenti e ho cercato di risolvermi usando l'induzione, ma non ci sono riuscito.

Sto cercando di semplificare una distribuzione che sembra ridurre a una statistica d'ordine di un insieme infinito numerabile di indipendenti variabili casuali con differenti gradi di libertà; nello specifico, qual è la distribuzione del ° valore più piccolo tra gli indipendenti ?χ2mχ22,χ42,χ62,χ82,

Sarei interessato al caso speciale : qual è la distribuzione del minimo di (indipendente) ?m=1χ22,χ42,χ62,

Nel caso del minimo, sono stato in grado di scrivere la funzione di distribuzione cumulativa (CDF) come prodotto infinito, ma non posso semplificarlo ulteriormente. Ho usato il fatto che il CDF di è (Con , questo conferma il secondo commento di seguito sull'equivalenza con una distribuzione esponenziale con aspettativa 2.) Il CDF del minimo può quindi essere scritto come Il primo termine nel prodotto è solo e ^ {- x / 2} e il termine "ultimo" èχ2m2m = 1 F m i n ( x ) = 1 - ( 1 - F 2 ( x ) ) ( 1 - F 4 ( x ) ) = 1 - m = 1 ( 1 - F 2 m ( x ) ) = 1 - m =

F2m(x)=γ(m,x/2)/Γ(m)=γ(m,x/2)/(m1)!=1ex/2k=0m1xk/(2kk!).
m=1
Fmin(x)=1(1F2(x))(1F4(x))=1m=1(1F2m(x))
e-x/2e-x/2 k = 0 xk/(2kk!)=1
=1m=1(ex/2k=0m1xk2kk!).
ex/2ex/2k=0xk/(2kk!)=1 . Ma non so come (se possibile?) Semplificarlo da lì. O forse è meglio un approccio completamente diverso.

Un altro promemoria potenzialmente utile: χ22 è lo stesso di una distribuzione esponenziale con aspettativa 2, e χ42 è la somma di due di questi esponenziali, ecc.

Se qualcuno è curioso, sto cercando di semplificare il Teorema 1 in questo documento per il caso di regressione su una costante ( xi=1 per tutti i ). (Ho χ2 invece di Γ poiché ho moltiplicato per 2κ .)


Ha questa risposta alla domanda?
mpiktas,

@mpiktas: grazie per il suggerimento. È simile, tranne che per gli esponenziali con parametri di velocità diversi, ho chi-quadrati con diversi gradi di libertà (e un numero infinito di essi, non finito). E mentre è un esponenziale, non lo sono; sono somme di esponenziali, ma somme di esponenziali non sono esse stesse esponenziali. (E idealmente spero in una statistica dell'ordine generale, anche se il minimo sarebbe un ottimo inizio.)χ22χ42,χ62,
David M Kaplan,

1
Dubito che ci sia un modulo chiuso per questo. Ha una caratterizzazione curiosa, tuttavia: quando è tra Poisson ( ), , allora è la possibilità che tutti . Xkλ/2k=1,2,1Fmin(λ)Xkk
whuber

1
@whuber: Forse non è così curioso se pensato in termini di un processo di Poisson, che è la formulazione con cui avevo giocato. Lascia che siano iid variabili casuali, con il corrispondente processo di Poisson della tariffa . Sia , , , ecc. Quindi, gli sono indipendenti e dalla proprietà stazionaria degli incrementi indipendenti di un processo Poisson, noi avere che . E x p ( 1 / 2 ) N ( 6 U i ~ χ 2 2 i P ( U it ) = P ( N ( t ) i )T1,T2,Exp(1/2)N(t):=sup{n:i=1nTit}1/2U1=T1U2=T2+T3U3=T4+T5+T6Uiχ2i2P(Uit)=P(N(t)i)
cardinale

@Cardinal Naturalmente: è un buon modo per vederlo. La curiosità non è nel rapporto tra Poissons e Gammas; sta nella descrizione dell'evento stesso!
whuber

Risposte:


8

Gli zeri del prodotto infinito saranno l'unione degli zeri dei termini. Il calcolo al 20 ° termine mostra lo schema generale:

trama di zeri complessi

Questo diagramma degli zeri nel piano complesso distingue i contributi dei singoli termini nel prodotto mediante simboli diversi: ad ogni passo, le curve apparenti vengono estese ulteriormente e una nuova curva viene avviata ancora più a sinistra.

La complessità di questo quadro dimostra che non esiste una soluzione a forma chiusa in termini di funzioni ben note di analisi superiore (come gamme, thetas, funzioni ipergeometriche, ecc., Così come le funzioni elementari, come rilevato in un testo classico come Whittaker & Watson ).

Pertanto, il problema potrebbe essere presentato in modo più fruttuoso in modo leggermente diverso : cosa devi sapere sulle distribuzioni delle statistiche degli ordini? Stime delle loro funzioni caratteristiche? Momenti di basso ordine? Approssimazioni ai quantili? Qualcos'altro?


Perché gli zero del prodotto sono importanti? Sento che mi manca qualcosa di banale.
mpiktas,

2
@mp Gli zeri e i poli mostrano qualcosa sulla complessità della funzione. Le funzioni razionali ne hanno un numero finito. Le funzioni elementari in genere hanno una linea di zeri, come ad esempio , integral, per ; le tipiche funzioni "trascendentali" hanno modelli leggermente più complessi di zeri, come ad esempio tutti gli interi non positivi (reciproco della funzione Gamma) o su un reticolo di punti (funzioni theta e funzioni ellittiche). Lo schema complicato qui esposto suggerisce che sarà difficile o impossibile esprimere il CDF in termini di queste funzioni familiari. 2iπnnexp()
whuber

2
@whuber (1/2), grazie! Non sapevo delle diverse classi di funzioni che avevano quei diversi schemi di zero nel piano complesso; sembra molto utile e il tuo grafico sembra rispondere alla mia domanda (come posato).
David M Kaplan,

@whuber (2/2), stava verificando un caso speciale di una (complicata) distribuzione di uno stimatore fornita in un altro documento. Hanno usato l'esistenza della distribuzione per giustificare l'uso di bootstrap; il mio consulente mi ha suggerito di provare ad approssimare la distribuzione. Sembra che la loro distribuzione potrebbe essere disattivata per questo caso speciale (dove so cosa dovrebbe essere), quindi controllerò con il mio consulente dopo il termine di concessione; ma potenzialmente, proverei a prendere un'espansione di ordine superiore del -order-stat (diviso per ) come , in un contesto più complicato. Invierò nuovamente in tal caso; grazie ancora! mmm
David M Kaplan,

4

qual è la distribuzione del minimo di (indipendente) ?χ22,χ42,χ62,

Ci scusiamo per l'arrivo con circa 6 anni di ritardo. Anche se probabilmente il PO si è spostato su altri problemi, la domanda rimane fresca e ho pensato di suggerire un approccio diverso.


Ci viene dato dove dove con di pdf :(X1,X2,X3,)XiChisquared(vi)vi=2ifi(xi)

inserisci qui la descrizione dell'immagine

Ecco un grafico del corrispondente del pdf , all'aumentare della dimensione del campione, per :fi(xi)i=1 to 8

inserisci qui la descrizione dell'immagine

Siamo interessati alla distribuzione di .min(X1,X2,X3,)

Ogni volta che aggiungiamo un termine aggiuntivo, il pdf dell'ultimo termine marginale aggiunto si sposta sempre più a destra, in modo che l'effetto di aggiungere sempre più termini diventi non solo sempre meno rilevante, ma dopo pochi termini , diventa quasi trascurabile - sul minimo del campione. Ciò significa, in effetti, che è probabile che contenga solo un numero molto piccolo di termini ... e l'aggiunta di termini aggiuntivi (o la presenza di un numero infinito di termini) è in gran parte irrilevante per il problema minimo del campione.

Test

Per verificarlo, ho calcolato il pdf di a 1 termine, 2 termini, 3 termini, 4 termini, 5 termini, 6 termini, 7 termini, 8 termini, a 9 termini e a 10 termini. Per fare questo, ho usato la funzione di mathStatica , dandogli istruzioni qui per calcolare il pdf del minimo del campione (la statistica dell'ordine ) in un campione di dimensione , e dove parametro (invece di essere risolto) è :1 ° j i v imin(X1,X2,X3,)OrderStatNonIdentical1stjivi

inserisci qui la descrizione dell'immagine inserisci qui la descrizione dell'immagine

Diventa un po 'complicato con l'aumentare del numero di termini ... ma ho mostrato l'output per 1 termine (prima riga), 2 termini (seconda riga), 3 termini (3a riga) e 4 termini sopra.

Il diagramma seguente confronta il pdf del campione minimo con 1 termine (blu), 2 termini (arancione), 3 termini e 10 termini (rosso). Nota quanto sono simili i risultati con solo 3 termini contro 10 termini: inserisci qui la descrizione dell'immagine

Il diagramma seguente confronta 5 termini (blu) e 10 termini (arancione): i grafici sono così simili, si annullano a vicenda e non si vede nemmeno la differenza:

inserisci qui la descrizione dell'immagine

In altre parole, aumentare il numero di termini da 5 a 10 non ha quasi alcun impatto visivo visibile sulla distribuzione del minimo del campione.

Approssimazione semi-logistica

Infine, un'eccellente semplice approssimazione del pdf del campione minimo è la distribuzione semi-logistica con pdf:

g(x)=2ex(ex+1)2 for x>0

Il diagramma seguente confronta la soluzione esatta con 10 termini (che è indistinguibile da 5 termini o 20 termini) e l'approssimazione semi-logistica (tratteggiata):

inserisci qui la descrizione dell'immagine

L'aumento a 20 termini non fa alcuna differenza.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.