Perché la regressione Beta / Dirichlet non è considerata un modello lineare generalizzato?


26

La premessa è questa citazione dalla vignetta del pacchetto R betareg1 .

Inoltre, il modello condivide alcune proprietà (come predittore lineare, funzione di collegamento, parametro di dispersione) con modelli lineari generalizzati (GLM; McCullagh e Nelder 1989), ma non è un caso speciale di questo framework (nemmeno per dispersione fissa )

Questa risposta fa anche allusione al fatto:

[...] Questo è un tipo di modello di regressione che è appropriato quando la variabile di risposta è distribuita come Beta. Puoi considerarlo analogo a un modello lineare generalizzato. È esattamente quello che stai cercando [...] (enfatizza il mio)

Il titolo della domanda dice tutto: perché la regressione Beta / Dirichlet non è considerata un modello lineare generalizzato (no)?


Per quanto ne so, il modello lineare generalizzato definisce i modelli basati sull'aspettativa delle loro variabili dipendenti subordinate a quelle indipendenti.

f è la funzione di collegamento che mappa l'aspettativa, è la distribuzione di probabilità, i risultati e i predittori, sono parametri lineari e la varianza.gYXβσ2

f(E(YX))g(βX,Iσ2)

GLM diversi impongono (o rilassano) la relazione tra la media e la varianza, ma deve essere una distribuzione di probabilità nella famiglia esponenziale, una proprietà desiderabile che dovrebbe migliorare la solidità della stima se ricordo bene. Le distribuzioni Beta e Dirichlet fanno parte della famiglia esponenziale, quindi non ho idee.g


[1] Cribari-Neto, F., & Zeileis, A. (2009). Regressione beta in R.



@amoeba Grazie per il link, non avevo mai visto prima questa domanda.
Firebug,

2
Penso che il problema sia che mentre se scrivi la distribuzione beta con i parametri standard , (cioè implica uniforme (0,1)), allora la distribuzione beta è nella famiglia esponenziale, se la scrivi in termini di (media) e (dispersione), non lo è. Ma non mi è mai importato così tanto se una distribuzione appartiene alla famiglia esponenziale. aba=b=1μϕ
Cliff AB,

@CliffAB Dopo aver letto i commenti sotto la risposta di Tim in basso sembra che la parametrizzazione della Beta porti alla non ortogonalità dei parametri, che sembra essere un requisito per i GLM McCullagh-Nelder.
Firebug,

1
Penso che questa breve risposta: stats.stackexchange.com/a/18812/28666 sia pertinente e si aggiunga alle risposte qui (accennando al motivo per cui i GLM erano originariamente definiti con la famiglia di dispersione esponenziale).
ameba dice di reintegrare Monica il

Risposte:


20

Controlla il riferimento originale:

Ferrari, S., e Cribari-Neto, F. (2004). Regressione beta per tassi e proporzioni di modellazione. Journal of Applied Statistics, 31 (7), 799-815.

come notano gli autori, i parametri della distribuzione beta parametrizzata sono correlati, quindi

Si noti che i parametri e non sono ortogonali, contrariamente a quanto verificato nella classe dei modelli di regressione lineare generalizzata (McCullagh e Nelder, 1989).βϕ

Quindi, sebbene il modello assomigli a un GLM e cuci come un GLM, non si adatta perfettamente al framework.


7
+1 ma sarebbe bello avere una risposta più dettagliata. Personalmente, non capisco la citazione (anche dopo aver aperto il documento collegato). Perché questi parametri non sono ortogonali nella regressione beta? .. Perché è necessario per i GLM? .. Ecc.
ameba dice Reinstate Monica il

3
@amoeba onestamente, non sono il tipo di persona che può darti una risposta dettagliata al riguardo. Non sono mai stato così interessato alla teoria alla base dei GLM da avere una comprensione abbastanza profonda di tali sottigliezze. McCullagh e Nelder menzionano questo requisito, ma dovrei controllare il loro libro per capire perché esattamente è importante. Se qualcuno desse una spiegazione dettagliata del motivo per cui questo è un problema, prenderei in considerazione la concessione di una generosità per tale risposta.
Tim

9
Il requisito di ortogonalità nei GLM è importante: significa che è possibile stimare l'equazione senza preoccuparsi di specificare erroneamente il resto della probabilità. Le stime dei parametri sono coerenti se l'equazione media sopra è specificata correttamente. L'inferenza è valida se inoltre la varianza è specificata correttamente. Tuttavia, nella regressione beta non è possibile separare le due equazioni del modello in questo modo, anche se è solo una costante. Per risultati coerenti, tutto deve essere specificato correttamente. g(μ)=xβϕ
Achim Zeileis,

3
@AchimZeileis Mi sono ricordato di aver visto il tuo nome su CV. Quello che dici ha perfettamente senso. Forse ti piacerebbe trasformare il tuo commento in risposta aggiungendo qualche altra logica? Come ho detto, sarei felice di assegnare la ricompensa per qualcuno che dà una risposta abbastanza dettagliata per la domanda.
Tim

2
@Tim Proverò a farlo quando avrò più tempo. Ecco perché pensavo che un breve commento fosse meglio di niente ...
Achim Zeileis,

8

La risposta di @probabilityislogic è sulla buona strada.

La distribuzione beta è nella famiglia esponenziale a due parametri . I semplici modelli GLM descritti da Nelder e Wedderburn (1972) non includono tutte le distribuzioni nella famiglia esponenziale dei due parametri.

In termini dell'articolo di N&W, il GLM si applica alle funzioni di densità del seguente tipo (questo fu in seguito chiamato famiglia di dispersione esponenziale a Jørgensen 1987 ):

π(z;θ,ϕ)=exp[α(ϕ){zθg(θ)+h(z)}+β(ϕ,z)]

con una funzione di collegamento aggiuntiva e modello lineare per il parametro naturale .f()θ=f(μ)=f(Xβ)


Quindi potremmo riscrivere anche la distribuzione sopra:

π(z;μ,ϕ)=exp[z(f(μ)α(ϕ))+h(z)α(ϕ)g(f(μ))α(ϕ)+β(ϕ,z)]

La famiglia esponenziale con due parametri è:

f(z;θ1,θ2)=exp[T1(z)η1(θ1,θ2)+T2(z)η2(θ1,θ2)g(θ1,θ2)+h(z)]

che sembra simile ma più generale (anche se uno dei è costante).θ


La differenza è chiara, e anche mettere la distribuzione beta in una forma come GLM non è possibile.

Tuttavia, mi manca una comprensione sufficiente per creare una risposta più intuitiva e ben informata (ho la sensazione che possano esserci relazioni molto più profonde ed eleganti con una varietà di principi fondamentali). Il GLM generalizza la distribuzione dell'errore utilizzando un modello di dispersione esponenziale a singola variabile al posto di un modello dei minimi quadrati e generalizza la relazione lineare nella media, utilizzando una funzione di collegamento.

L'intuizione migliore e più semplice sembra essere la dispersione- -term nell'esponenziale, che si moltiplica con tutto e quindi la dispersione non varia con . Considerando che due famiglie di parametri esponenziali e metodi di quasi verosimiglianza, consentono anche al parametro di dispersione di essere una funzione di .α(ϕ)θθ


Il secondo parametro in N&W definito df è la dispersione. Si estende l'unico parametro famiglia esponenziale naturaleϕπ(z;θ)
Sesto Empirico

@amoeba beta è una distribuzione esponenziale bivariata della famiglia, ad esempio www2.stat.duke.edu/courses/Spring11/sta114/lec/expofam.pdf
Tim

2
Non sono sicuro che non sia del tutto possibile, anche con dispersione fissa. Almeno non secondo la glm come affermato da N&W (quello che so è che molte persone fanno cose molto più difficili per risolvere la regressione beta). Modificherò la risposta per mostrare cosa succede e dove va storto, se proviamo a seguire lo stesso percorso dei minimi quadrati iterativi ripesati.
Sesto Empirico

2
Ho modificato la risposta in qualche modo. 1) La mia descrizione iniziale delle famiglie e dei modelli di dispersione era errata. Il GLM include tutte le distribuzioni delle famiglie esponenziali di un parametro perché non è solo quella funzione di densità, ma anche una funzione di collegamento. 2) In termini di una migliore visione intuitiva non potevo andare lontano e non mi aspetto di andare molto presto. I modelli GLM si riferiscono al modello classico in varie rappresentazioni, aggiungendo pesi alla formulazione matriciale delle procedure di adattamento, derivati ​​delle funzioni di verosimiglianza, inclusi i termini con la funzione di collegamento e la varianza, .....
Sextus Empiricus,

2
Mi sono preso la libertà di modificare un po 'la tua risposta, spero che tu stia bene con le modifiche. Inoltre, sembra che questa risposta stats.stackexchange.com/a/18812/28666 suggerisca perché N&W abbia usato questa particolare famiglia di distribuzione e non una più ampia.
ameba dice Ripristina Monica il

2

Non penso che la distribuzione beta faccia parte della famiglia di dispersione esponenziale . Per ottenere questo, devi avere una densità

f(y;θ,τ)=exp(yθc(θ)τ+d(y,τ))

per le funzioni specificate e . La media è data come e la varianza è data come . Il parametro è chiamato parametro canonico.c()d()c(θ)τc(θ)θ

La distribuzione beta non può essere scritto in questo modo - un modo di vedere questo è da notare non c'è termine la probabilità di registro - ha e inveceylog[y]log[1y]

fbeta(y;μ,ϕ)=exp(ϕμlog[y1y]+ϕlog[1y]log[B(ϕμ,ϕ(1μ)]log[y1y])

Un altro modo per vedere che beta non è una famiglia di dispersione esponenziale è che può essere scritto come cui e sono indipendenti ed entrambi seguono distribuzioni gamma con lo stesso parametro di scala (e gamma è una famiglia esponenziale).y=xx+zxz


1
Questa risposta non è corretta come scritto. Un modo per vederlo è che, secondo la logica presentata, le distribuzioni di Bernoulli e binomiali, per esempio, non sarebbero neppure nella classe delle famiglie esponenziali.
cardinale il

2
Scusa, hai ragione nel dire che l'esempio che ho dato è stato errato. (Attenzione: l'aritmetica mentale e l'uso mobile di CrossValidated possono essere pericolosi!) Tuttavia, il mio punto è ancora valido . Questa risposta è errata perché opta per un concetto molto "definito" di "famiglia esponenziale", molto più ristretto di qualsiasi fonte convenzionale o uso pratico.
cardinale il

2
Hmm. Wikipedia elenca la beta nell'elenco delle distribuzioni familiari esponenziali.
ameba dice Reinstate Monica il

1
Vero - Stavo pensando di naturale, famiglia esponenziale - che è un caso speciale
probabilityislogic

1
Il parametro nella funzione è anche descritto da una funzione di collegamento, e quindi questa funzione di distribuzione definita in modo restrittivo diventa più ampia, comprese tutte le distribuzioni della famiglia esponenziale di un parametro, ma solo una parte della famiglia esponenziale di due parametri. θ
Sesto Empirico,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.