Non credo che il titolo della tua domanda catturi accuratamente ciò che stai chiedendo.
La domanda su come interpretare i parametri in un GLM è molto ampia perché il GLM è una classe molto ampia di modelli. Ricordiamo che un GLM modella una variabile di risposta che si presume segua una distribuzione nota della famiglia esponenziale e che abbiamo scelto una funzione invertibile gyg tale che
per levariabili predittive J x . In questo modello, l'interpretazione di ogni particolare parametro β j è la velocità di variazione di g ( y ) rispetto a x j . Definire μ ≡ E [ y
E[y|x]=g−1(x0+x1β1+⋯+xJβJ)
Jxβjg(y)xj e
η≡x⋅βper mantenere pulita la notazione. Quindi, per qualsiasi
j∈{1,...,J},
β j = ∂μ≡E[y|x]=g−1(x)η≡x⋅βj∈{1,…,J}
Ora definire
ejessere un vettore di
J-1zeri e un singolo
1nella
jesima posizione, in modo che per esempio se
J=5allora
E3=(0,0,1,0,0). Quindi
βj=g(E [ yβj=∂η∂xj=∂g(μ)∂xj.
ejJ−11jJ=5e3=(0,0,1,0,0)βj=g(E[y|x+ej])−g(E[y|x])
Il che significa solo che è l'effetto su η di un aumento di unità in x j .βjηxj
Puoi anche dichiarare la relazione in questo modo:
ed
E[y
∂E[y|x]∂xj=∂μ∂xj=dμdη∂η∂xj=∂μ∂ηβj=dg−1dηβj
E[y|x+ej]−E[y|x]≡Δjy^=g−1((x+ej)β)−g−1(xβ)
Senza sapere nulla di , questo è quanto possiamo. β j è l'effetto su η , sulla media condizionale trasformata di y , di un aumento di unità in x j , e l'effetto sulla media condizionale di y di un aumento di unità in x j è g - 1 ( β ) .gβjηyxjyxjg−1(β)
Ma sembra che tu stia chiedendo specificamente della regressione di Poisson usando la funzione di collegamento predefinita di R, che in questo caso è il logaritmo naturale. Se questo è il caso, si sta chiedendo uno specifico tipo di GLM , in cui e g = ln . Quindi possiamo ottenere una certa trazione rispetto a un'interpretazione specifica.y∼Poisson(λ)g=ln
Da quanto ho detto sopra, sappiamo che . E poiché conosciamog(μ)=ln(μ), sappiamo anche cheg-1(η)=eη. Ci capita anche di sapere chedeη∂μ∂xj=dg−1dηβjg(μ)=ln(μ)g−1(η)=eη, quindi possiamo dire che
∂μdeηdη=eη
∂μ∂xj=∂E[y|x]∂xj=ex0+x1β1+⋯+xJβJβj
che finalmente significa qualcosa di tangibile:
Dato un piccolo cambiamento di , l'aderente y varia da yxjy^ .y^βj
Nota: questa approssimazione può effettivamente funzionare per modifiche fino a 0,2, a seconda della precisione necessaria.
E utilizzando l'interpretazione più familiare variazione unitaria, abbiamo:
Δjy^=ex0+x1β1+⋯+(xj+1)βj+⋯+xJβJ−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJ+βj−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJeβj−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJ(eβj−1)
which means
Given a unit change in xj, the fitted y^ changes by y^(eβj−1).
There are three important pieces to note here:
- The effect of a change in the predictors depends on the level of the response.
- An additive change in the predictors has a multiplicative effect on the response.
- You can't interpret the coefficients just by reading them (unless you can compute arbitrary exponentials in your head).
So in your example, the effect of increasing pH by 1 is to increase lny^ by y^(e0.09−1); that is, to multiply y^ by e0.09≈1.09. It looks like your outcome is the number of darters you observe in some fixed unit of time (say, a week). So if you're observing 100 darters a week at a pH of 6.7, raising the pH of the river to 7.7 means you can now expect to see 109 darters a week.