Derivazione della trasformata normalizzante per GLM


15

modo A()=duV1/3(μ) trasforma la normalizzazione per la famiglia esponenziale derivato?

Più specificamente : ho provato a seguire lo schizzo di espansione di Taylor a pagina 3, diapositiva 1 qui, ma ho diverse domande. Con X di una famiglia esponenziale, trasformazione h(X) e κi indica l'accumulatore ith , le diapositive sostengono che:

κ3(h(X¯))h(μ)3κ3(X¯)N2+3h(μ)2h(μ)σ4N+O(N3),
e resta da trovare semplicemente h(X) modo che quanto sopra valga 0.
  1. La mia prima domanda riguarda l'aritmetica: la mia espansione di Taylor ha coefficienti diversi e non posso giustificare la loro caduta di molti termini.

    Since h(x)h(μ)+h(μ)(xμ)+h(x)2(xμ)2, we have:h(X¯)h(u)h(u))(X¯μ)+h(x)2(X¯μ)2E(h(X¯)h(u))3h(μ)3E(X¯μ)3+32h(μ)2h(μ)E(X¯μ)4+34h(μ)h(μ)2E(X¯μ)5+18h(μ)3E(X¯μ)6.

    Posso arrivare a qualcosa di simile sostituendo i momenti centrali con i loro equivalenti cumulativi, ma ancora non si sommano.

  2. La seconda domanda: perché l'analisi inizia con X¯ anziché X , la quantità che ci interessa davvero?


ti sembra di avere u molte volte in cui questo criterio μ
Glen_b -Reinstate Monica

Risposte:


2

Le diapositive a cui ti colleghi sono piuttosto confuse, tralasciando i passaggi e facendo alcuni errori di battitura, ma alla fine sono corrette. Aiuterà a rispondere prima alla domanda 2, quindi a 1, quindi alla trasformazione simmetrica .A(u)=u1[V(θ)]1/3dθ

Domanda 2. Stiamo analizzando come media di un campione di dimensione di variabili casuali iid . Questa è una quantità importante perché campionare la stessa distribuzione e prendere la media avviene continuamente nella scienza. Vogliamo sapere quanto è vicino alla vera media . Il Teorema del limite centrale dice che converge in come ma vorremmo conoscere la varianza e l'asimmetria di . NX1,. . . ,XN ˉ X μμN ˉ XX¯NX1,...,XNX¯μμNX¯

Domanda 1. L'approssimazione della serie Taylor non è errata, ma dobbiamo stare attenti a tenere traccia di contro e i poteri di per arrivare alla stessa conclusione delle diapositive. Inizieremo con le definizioni di e i momenti centrali di e la formula per : XiN ˉ X Xiκ3(h( ˉ X ))X¯XiNX¯Xiκ3(h(X¯))

X¯=1Ni=1NXi

E[Xi]=μ

V(Xi)=E[(Xiμ)2]=σ2

κ3(Xi)=E[(Xiμ)3]

Ora, i momenti centrali di :X¯

E[X¯]=1Ni=1NE[Xi]=1N(Nμ)=μ

V(X¯)=E[(X¯μ)2]=E[((1Ni=1NXi)μ)2]=E[(1Ni=1N(Xiμ))2]=1N2(NE[(Xiμ)2]+N(N1)E[Xiμ]E[Xjμ])=1Nσ2

L'ultimo passaggio segue poiché e . Potrebbe non essere stata la derivazione più semplice di , ma è lo stesso processo che dobbiamo fare per trovare e , in cui suddividiamo un prodotto di una somma e contiamo il numero di termini con potenze di variabili diverse. Nel caso precedente, c'erano termini che erano della forma e termini della forma .E[Xiμ]=0E[(Xiμ)2]=σ2V(X¯)κ3(X¯)κ3(h(X¯))N(Xiμ)2N(N1)(Xiμ)(Xjμ)

κ3(X¯)=E[(X¯μ)3)]=E[((1Ni=1NXi)μ)3]=E[(1Ni=1N(Xiμ))3]=1N3(NE[(Xiμ)3]+3N(N1)E[(Xiμ)E[(Xjμ)2]+N(N1)(N2)E[(Xiμ)]E[(Xjμ)]E[(Xkμ)]=1N2E[(Xiμ)3]=κ3(Xi)N2

Successivamente, espanderemo in una serie di Taylor come hai:h(X¯)

h(X¯)=h(μ)+h(μ)(X¯μ)+12h(μ)(X¯μ)2+13h(μ)(X¯μ)3+...

E[h(X¯)]=h(μ)+h(μ)E[X¯μ]+12h(μ)E[(X¯μ)2]+13h(μ)E[(X¯μ)3]+...=h(μ)+12h(μ)σ2N+13h(μ)κ3(Xi)N2+...

Con qualche sforzo in più potresti provare che il resto dei termini sono . Infine, poiché , (che non è lo stesso di ), facciamo di nuovo un calcolo simile:O(N3)κ3(h(X¯))=E[(h(X¯)E[h(X¯)])3]E[(h(X¯)h(μ))3]

κ3(h(X¯))=E[(h(X¯)E[h(X¯)])3]=E[(h(μ)+h(μ)(X¯μ)+12h(μ)(X¯μ)2+O((X¯μ)3)h(μ)12h(μ)σ2NO(N2))3]

Siamo interessati solo ai termini risultanti nell'ordine e con un lavoro extra potresti dimostrare che non hai bisogno dei termini " "o" "prima di prendere la terza potenza, poiché si tradurranno solo in termini di ordine . Quindi, semplificando, otteniamoO(N2)O((X¯μ)3)O(N2)O(N3)

κ3(h(X¯))=E[(h(μ)(X¯μ)+12h(μ)(X¯μ)212h(μ)σ2N))3]=E[h(μ)3(X¯μ)3+18h(μ)3(X¯μ)618h(μ)3σ6N3+32h(μ)2h(μ)(X¯μ)4+34h(μ)h(μ)(X¯μ)532h(μ)2h(μ)(X¯μ)2σ2N+O(N3)]

Ho lasciato alcuni termini che erano ovviamente in questo prodotto. Dovrai convincerti che i termini e sono pure. Tuttavia,O(N3)E[(X¯μ)5]E[(X¯μ)6]O(N3)

E[(X¯μ)4]=E[1N4(i=1N(X¯μ))4]=1N4(NE[(Xiμ)4]+3N(N1)E[(Xiμ)2]E[(Xjμ)2]+0)=3N2σ4+O(N3)

Quindi distribuendo le aspettative sulla nostra equazione per , abbiamoκ3(h(X¯))

κ3(h(X¯))=h(μ)3E[(X¯μ)3]+32h(μ)2h(μ)E[(X¯μ)4]32h(μ)2h(μ)E[(X¯μ)2]σ2N+O(N3)=h(μ)3κ3(Xi)N2+92h(μ)2h(μ)σ4N232h(μ)2h(μ)σ4N2+O(N3)=h(μ)3κ3(Xi)N2+3h(μ)2h(μ)σ4N2+O(N3)

Questo conclude la derivazione di . Ora, finalmente, deriveremo la trasformazione simmetrica .κ3(h(X¯))A(u)=u1[V(θ)]1/3dθ

Per questa trasformazione, è importante che da una distribuzione esponenziale della famiglia, e in particolare una famiglia esponenziale naturale (o sia stata trasformata in questa distribuzione), della formaXifXi(x;θ)=h(x)exp(θxb(θ))

In questo caso, i cumulativi della distribuzione sono dati da . Quindi , e . Possiamo scrivere il parametro in funzione di prendendo semplicemente l'inverso di , scrivendo . Poiκk=b(k)(θ)μ=b(θ)σ2=V(θ)=b(θ)κ3=b(θ)θμbθ(μ)=(b)1(μ)

θ(μ)=1b((b)1(μ))=1b(θ))=1σ2

Quindi possiamo scrivere la varianza in funzione di e chiamare questa funzione :μV¯

V¯(μ)=V(θ(μ))=b(θ(μ))

Poi

ddμV¯(μ)=V(θ(μ))θ(μ)=b(θ)1σ2=κ3σ2

Quindi in funzione di , .μκ3(μ)=V¯(μ)V¯(μ)

Ora, per la trasformazione simmetrica, vogliamo ridurre l'asimmetria di creando modo che sia . Quindi, vogliamoh(X¯)h(μ)3κ3(Xi)N2+3h(μ)2h(μ)σ4N2=0h(X¯)O(N3)

h(μ)3κ3(Xi)+3h(μ)2h(μ)σ4=0

Sostituendo le nostre espressioni per e come funzioni di , abbiamo:σ2κ3μ

h(μ)3V¯(μ)V¯(μ)+3h(μ)2h(μ)V¯(μ)2=0

Quindi , che porta a .h(μ)3V¯(μ)+3h(μ)2h(μ)V¯(μ)=0ddμ(h(μ)3V¯(μ))=0

Una soluzione a questa equazione differenziale è:

h(μ)3V¯(μ)=1 ,

h(μ)=1[V¯(μ)]1/3

Quindi, , per qualsiasi costante, . Questo ci dà la trasformazione simmetrica , dove è la varianza come una funzione della media in una famiglia esponenziale naturale.h(μ)=cμ1[V¯(θ)]1/3dθcA(u)=u1[V(θ)]1/3dθV


1

non posso ottenere lo stesso risultato approssimando in termini di momenti non centrali e quindi calcolare i momenti centrali usando i momenti non centrali approssimativi?EX¯kE(X¯EX¯)k

Perché si modifica arbitrariamente la derivazione e si rilascia il termine residuo che è importante. Se non si ha familiarità con la notazione O grande e i risultati rilevanti, un buon riferimento è [Casella & Lehmann].

h(X¯)h(u)h(u)(X¯μ)+h(x)2(X¯μ)2+O[(X¯μ)3]

E[h(X¯)h(u)]h(u)E(X¯μ)+h(x)2E(X¯μ)2+(?)

Ma anche se non lasci cadere il residuo sostenendo che stai sempre facendo (che non è legale ...), il seguente passo: sta dicendo cheN

\E(h(X¯)h(u))3h(μ)3\E(X¯μ)3+32h(μ)2h(μ)\E(X¯μ)4+34h(μ)h(μ)2\E(X¯μ)5+18h(μ)3\E(X¯μ)6.(1)
[h(x)h(x0)]3dx=[h(x0)(xx0)+12h(x0)(xx0)2+O((xx0)3)]3dx=(1)

se ciò non è ancora chiaro, possiamo vedere che l'algebra dell'espansione dell'integrando va come

[h(x0)(xx0)+12h(x0)(xx0)2+O((xx0)3)]3(2)

Lettere , ,A=h(x0)(xx0)B=12h(x0)(xx0)2C=O((xx0)3) (2)=[A+B+C]3 [A3+3A2B+3AB2+B3]=[A+B]3=(1)

Il tuo errore è omettere il residuo prima dell'espansione, che è un errore "classico" nella notazione O grande e in seguito divenne una critica all'uso della notazione O grande.

2.Perché l'analisi inizia con anziché , la quantità che ci interessa davvero?X¯X

Perché vogliamo basare la nostra analisi sulle statistiche sufficienti del modello esponenziale che stiamo introducendo. Se hai un campione di dimensione 1, non c'è differenza se analizzi con OR .X¯=1ni=1nXiX1

Questa è una buona lezione in notazione O grande anche se non è rilevante per GLM ...

Riferimento [Casella & Lehmann] Lehmann, Erich Leo e George Casella. Teoria della stima puntuale. Springer Science & Business Media, 2006.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.