Se ,


9

Supponiamo che il seguente set:
Let Zi=min{ki,Xi},i=1,...,n . Anche XiU[ai,bi],ai,bi>0 . Inoltre ki=cai+(1c)bi,0<c<1 cioè ki è una combinazione convessa dei confini dei rispettivi supporti. c è comune per tutti i .

Io penso che ho la distribuzione di Zi destra: si tratta di una distribuzione mista .
Ha una parte continua,

Xi[ai,ki),Zi=XiPr(Zizi)=ziaibiai
e quindi una discontinuità e una parte discreta in cui concentrati di massa probabilistici:
Pr(Zi=ki)=Pr(Xi>ki)=1Pr(Xiki)
=1kiaibiai=1(1c)(biai)biai=c

Quindi in tutto

FZi(zi)={0zi<aiziaibiaiaizi<ki1kizi

mentre per la funzione di massa / densità "discreta / continua" mista, è 0 al di fuori dell'intervallo [ai,ki] , ha una parte continua che è la densità di una U uniforme (a_i, b_i)U(ai,bi) , 1biai ma per aizi<ki e concentra la massa di probabilità positiva c>0 a zi=ki .

Complessivamente, si somma all'unità sui reali.

Vorrei essere in grado di derivare, o dire qualcosa, della distribuzione e / o dei momenti della variabile casuale Sni=1nZi , come n .

Ad esempio, se gli sono indipendenti, sembra come . Posso "ignorare" quella parte, anche come approssimazione? Quindi lasciato con una variabile casuale che varia nell'intervallo , che sembra la somma delle uniformi censurate, in di diventare "non censurato", e quindi forse un teorema limite centrale ... ma probabilmente sto divergendo piuttosto che convergere qui, quindi, qualche suggerimento?XiPr(Sn=inki)=cn0n[i=1nai,i=1nki)

PS: Questa domanda è rilevante, derivare la distribuzione della somma delle variabili censurate , ma la risposta di @Glen_b non è ciò di cui ho bisogno: devo lavorare analiticamente su questa cosa, anche usando approssimazioni. Questa è ricerca, quindi ti preghiamo di trattarla come un compito: suggerimenti generali o riferimenti alla letteratura sono abbastanza buoni.


Se ne hai bisogno, scrivi la distribuzione di come , con un adatto , in cui è un insieme di Borel. ZiμZi(B)=P(ZiB)=Bg(t)dt+cIB(ki)gB
Zen,

@Zen Ho già scritto nella domanda che la distribuzione è discontinua. Anche l'RHS di rende evidente che questa rappresenta una densità in , ma per una probabilità per -e preferisco la notazione compatta. ff[ai,ki)ki
Alecos Papadopoulos,

Per quanto ne so, questa notazione con stata un pdf e un pmf non esiste; e abbiamo il linguaggio matematico appropriato per descrivere con precisione le distribuzioni miste. Dubito che questa notazione sarà accettata quando pubblichi la tua ricerca. Solo la mia opinione, ovviamente. Dovresti sempre farlo nel modo che preferisci. f
Zen,

@Zen Publishing è molto più avanti, e in effetti i revisori si accigliano quando vedono una notazione non consolidata. Questo è solo una scorciatoia quando si vuole descrivere una distribuzione graduale in molte righe. Non c'è "argomento a favore" e contro la notazione stabilita, come ad esempio quella che hai usato in un commento precedente.
Alecos Papadopoulos,

Risposte:


5

Seguirei il consiglio di Henry e controllerei Lyapunov con . Il fatto che le distribuzioni siano miste non dovrebbe essere un problema, purché le e comportino correttamente. La simulazione del caso particolare in cui , , per ogni mostra che la normalità è ok.δ=1aibiai=0bi=1ki=2/3i1

xbar <- replicate(10^4, mean(pmin(runif(10^4), 2/3)))
hist((xbar - mean(xbar)) / sd(xbar), breaks = "FD", freq = FALSE)
curve(dnorm, col = "blue", lwd = 2, add = TRUE)

CLT


Anzi abbastanza normale. Buono a sapersi. Le solite condizioni per CLT non sono mai state un problema qui, la mia domanda era se ci fossero altri, forse sottili problemi che hanno distorto il risultato asintotico e richiesto un CLT modificato. La tua simulazione mostra che effettivamente la discreta discontinuità diventa trascurabile in probabilità quando più variabili entrano nella somma.
Alecos Papadopoulos,

Niente di specifico, ma non presentano alcun problema. Pensa anche a numeri finiti, indipendentemente dall'indice . Essi possono aumentare o diminuire cresce (nessuna regola specifica), e non uno qualsiasi di loro è sproporzionato rispetto a quello degli altri ... che rappresentano le differenze di dimensioni nondimeno entità "comparabili". Quindi le condizioni di Lindeberg valgono sicuramenteii
Alecos Papadopoulos,

Bello. Buona fortuna con i prossimi passi. Sembra un problema interessante.
Zen,

3

suggerimenti:

Supponendo che sia fisso e che sia indipendente, è possibile calcolare la media e la varianza di ogni : ad esempio e conosci . cXiμiσi2Ziμi=E[Zi]=cai+ki2+(1c)kiki=cai+(1c)bi

Quindi, a condizione che e non crescano troppo rapidamente, è possibile utilizzare le condizioni di Lyapunov o Lindeberg per applicare il teorema del limite centrale con la conclusione che converge nella distribuzione in un normale standard, o in un senso agitando la mano è approssimativamente normalmente distribuito con la media e varianza .aibi11nσi2(1nZi1nμi)1nZi1nμi1nσi2


Grazie. Non ci sono problemi con e , non crescono con l'indice, fluttuano solo attorno. Quindi stai dicendo essenzialmente che il CLT può coprire anche variabili casuali con distribuzioni miste? aibi
Alecos Papadopoulos,

Se ad esempio e fossero , allora avresti variabili casuali indipendenti identicamente distribuite con una varianza finita, quindi si applicherebbe il teorema limite centrale. Se questa è una distribuzione della miscela o meno non influisce su questo risultato. Quello che sto dicendo è che puoi estenderlo ai casi in cui le variabili casuali sono indipendenti ma non distribuite in modo identico, a condizione che i mezzi e le varianze rimangano ragionevoli. aibi
Henry,

2

La mia principale preoccupazione in questa domanda era se si potesse applicare il CLT "come al solito" nel caso che sto esaminando. L'utente @Henry ha affermato che si può, l'utente @Zen lo ha mostrato attraverso una simulazione. Così incoraggiato, ora lo dimostrerò analiticamente.

Quello che farò prima è verificare che questa variabile con la distribuzione mista abbia una funzione di generazione del momento "normale". Indica il valore atteso di , sua deviazione standard e la versione centrata e scalata di di . Applicando la formula del cambio di variabile troviamo che la parte continua è La funzione generatrice del momento di dovrebbe essere μiZiσiZiZ~i=Ziμiσi

fZ~(z~i)=σifZ(zi)=σibiai
Z~i
M~i(t)=E(ez~it)=ez~itdFZ~(z~i)=a~ik~iσiez~itbiaidzi+cek~it

M~i(t)=σibiaiek~itea~itt+cek~it
con
k~i=kiμiσi,a~i=aiμiσi

Usando i numeri primi per indicare i derivati, se abbiamo specificato correttamente la funzione di generazione del momento, dovremmo ottenere da questo è una variabile casuale centrata e ridimensionata. E in effetti, calcolando i derivati, applicando molte volte la regola di L'Hopital (poiché il valore dell'MGF a zero deve essere calcolato attraverso i limiti) e facendo manipolazioni algebriche, ho verificato le prime due uguaglianze. La terza uguaglianza si è rivelata troppo noiosa, ma confido che valga.

M~i(0)=1,M~i(0)=E(Z~)=0M~i(0)=E(Z~i2)=Var(Z~i)=1

Quindi abbiamo un MGF adeguato. Se portiamo la sua espansione di Taylor del 2 ° ordine intorno allo zero, abbiamo

M~(t)=M~(0)+M~(0)t+12M~(0)t2+o(t2)

M~(t)=1+12t2+o(t2)

Ciò implica che la caratteristica funzione (qui denota l'unità immaginaria) .i

ϕ~(t)=1+12(it)2+o(t2)=112t2+o(t2)

Dalle proprietà della funzione caratteristica , abbiamo che la funzione caratteristica di è uguale aZ~/n

ϕ~Z~/n(t)=ϕ~Z~(t/n)=1t22n+o(t2/n)

e poiché abbiamo variabili casuali indipendenti, la funzione caratteristica di è1ninZ~i

ϕ~1ninZ~i(t)=i=1nϕ~Z~(t/n)=i=1n(1t22n+o(t2/n))

Poi

limnϕ~1ninZ~i(t)=limn(1t22n)n=et2/2

da come è rappresentato il numeroe . Succede così che l'ultimo termine sia la funzione caratteristica della distribuzione normale standard, e dal teorema di continuità di Levy , abbiamo che

1ninZ~idN(0,1)

che è il CLT. Si noti che il fatto che le variabili non siano distribuite in modo non identico, "sono scomparse" alla vista quando abbiamo considerato le loro versioni centrate e ridimensionate e considerato l'espansione Taylor del 2 ° ordine del loro MGF / CHF: a quel livello di approssimazione, queste funzioni sono identici e tutte le differenze sono compattate nei termini rimanenti che scompaiono asintoticamente. Z

Il fatto che il comportamento idiosincratico a livello individuale, da tutti i singoli elementi, svanisca comunque quando consideriamo il comportamento medio, credo che sia molto ben messo in mostra usando una creatura cattiva come una variabile casuale con una distribuzione mista.


Davvero fantastico, Alecos. La mia sensazione è che l'argomento debba dipendere da condizioni più specifiche di e . Ad esempio: la prova si interrompe rapidamente se ? (So ​​che nella tua applicazione questo non succede.) Cosa ne pensi? aibi(biai)0
Zen,

@Zen Il problema riguardante le varianze di camper indipendenti ma non identicamente distribuiti è molto sottile, non credo di capirlo ancora chiaramente. Le condizioni note di Lyapunov o Lindeberg sono sufficienti solo per il CLT. Ci sono casi in cui il CLT è valido anche se queste condizioni non lo sono. Quindi penso che se non limitiamo le variazioni, allora non esiste una risposta unica e il problema diventa totalmente specifico per ogni caso. Anche il libro di Billingsley non è chiaro sulla questione. La domanda è come apparirà il resto e cosa possiamo dire al riguardo.
Alecos Papadopoulos,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.