Modello lineare non lineare o generalizzato: come ti riferisci alla regressione logistica, di Poisson, ecc.?


23

Ho una domanda sulla semantica su cui vorrei esprimere le opinioni degli altri statistici.

Sappiamo che modelli come la logistica, Poisson, ecc. Rientrano nell'ambito di modelli lineari generalizzati. Il modello include funzioni non lineari dei parametri, che possono a loro volta essere modellate utilizzando la struttura del modello lineare utilizzando la funzione di collegamento appropriata.

Mi chiedo se consideri (insegnare?) Situazioni come la regressione logistica come:

  1. Modello non lineare, data la forma dei parametri
  2. Modello lineare, poiché il collegamento ci trasforma nella struttura del modello lineare
  3. Contemporaneamente (1) e (2): "inizia" come un modello non lineare, ma può essere lavorato in modo tale da permetterci di pensarlo come un modello lineare

Vorrei poter impostare un vero sondaggio ...

Risposte:


24

Questa è un'ottima domanda

Sappiamo che modelli come la logistica, Poisson, ecc. Rientrano nell'ambito di modelli lineari generalizzati.

Bene, sì e no. Dato il contesto della domanda, dobbiamo essere abbastanza attenti a specificare di cosa stiamo parlando - e "la logistica" e "Poisson" da soli non sono sufficienti per descrivere ciò che è destinato.

(i) "Poisson" è una distribuzione. Come descrizione di una distribuzione condizionale, non è lineare (e quindi non è un GLM) a meno che non si specifichi un modello lineare (nei parametri) per descrivere la media condizionale (cioè non è sufficiente semplicemente dire "Poisson"). Quando le persone specificano "regressione di Poisson", hanno quasi sempre intenzione di un modello che è lineare nei parametri, ed è quindi un GLM. Ma "Poisson" da solo potrebbe essere qualsiasi numero di cose *.

(ii) "Logistica" si riferisce invece alla descrizione di una media (che la media è logistica nei predittori). Non è un GLM a meno che non lo abbini a una distribuzione condizionale che appartiene alla famiglia esponenziale. Quando le persone dicono " regressione logistica ", invece, significano quasi sempre un modello binomiale con collegamento logit - ciò significa che è logistico nei predittori, il modello è lineare nei parametri ed è nella famiglia esponenziale, quindi è un GLM.

Il modello include funzioni non lineari dei parametri,

Bene, ancora, sì e no.

η=g(μ)η=Xβ

che a sua volta può essere modellato utilizzando la struttura del modello lineare utilizzando la funzione di collegamento appropriata.

Corretta

Mi chiedo se consideri (insegnare?) Situazioni come la regressione logistica come:

(Sto cambiando l'ordine della tua domanda qui)

Modello lineare, poiché il collegamento ci trasforma nella struttura del modello lineare

È convenzionale definire un GLM "lineare", proprio per questo motivo. In effetti, è abbastanza chiaro che questa è la convenzione, perché è proprio lì nel nome .

Modello non lineare, data la forma dei parametri

Dobbiamo stare molto attenti qui, perché "non lineare" generalmente si riferisce a un modello che non è lineare nei parametri. Regressione regressiva non lineare con modelli lineari generalizzati.

Quindi, se si desidera utilizzare il termine "non lineare" per descrivere un GLM, è importante specificare attentamente ciò che si intende - generalmente, che la media non è linearmente correlata ai predittori.

In effetti, se usi "non lineare" per riferirti a GLM, ti troverai in difficoltà non solo con le convenzioni (e quindi rischia di essere frainteso), ma anche quando provi a parlare di modelli non lineari generalizzati . È un po 'difficile spiegare la distinzione se hai già definito i GLM come "modelli non lineari"!

g(μ)

Y~poisson(μX)

XYXμXX

μX=α+exp(βX).

Xα

Qui il primo termine rappresenta un tasso di mortalità costante dovuto a (diciamo) incidenti (o altri effetti non molto legati all'età) mentre il secondo termine ha un tasso di mortalità crescente a causa dell'età. Tale modello può forse essere talvolta realizzabile su brevi intervalli di età adulte successive ma non senescenti; è essenzialmente la legge di Makeham (qui presentata come una funzione di rischio, ma per la quale un tasso annuale sarebbe una ragionevole approssimazione).

Questo è un modello non lineare generalizzato.


Grazie per il tuo contributo. Questo è quello che sto cercando di ottenere. Ovviamente "lineare" è nel nome dei GLM. Sto cercando di classificare quei modelli che sono intrinsecamente non lineari (non sono lineari nei parametri), ma "trasformabili lineari", e quindi rientrano nel framework GLM. Immagino che forse ho appena risposto alla mia domanda: il modo migliore per fare riferimento a loro è "trasformabilmente non lineare".
Meg

1
Il modo più comune di riferirsi a un modello che può essere reso lineare in parametri da una trasformazione è "linearizzabile" (al contrario di "istrincicamente non lineare"). Penso che dobbiamo essere chiari su ciò che è lineare (rispetto a ciò che non è lineare) quando discutiamo del modello, e forse anche per essere chiari su come tali cose vengono convenzionalmente indicate, poiché le persone devono essere in grado di localizzare le informazioni e anche di essere comprese quando li discutiamo. Qualcuno che parla di GLM come "non lineare" è probabile che venga frainteso, a meno che non aggiungano i qualificatori corretti che ne chiariscono il significato.
Glen_b -Restate Monica

Sono d'accordo. La vedo solo classificata come regressione non lineare nei testi e anche i miei professori mi hanno insegnato che non è lineare. Personalmente lo trovo confuso dal momento che lo trattiamo nel framework GLM, eppure posso (almeno un po ') immedesimarmi nel chiamarlo. Penso che andrò con linearizzabile / trasformabile lineare e una discussione su come andiamo dal punto A al punto B (cioè come iniziamo con una funzione non lineare e la trasformiamo nel quadro lineare).
Meg

Sì, capisco perfettamente. Anche se provo empatia con il loro impulso a farlo, se avessi il loro orecchio li metterei in guardia contro la pratica di chiamarli modelli non lineari (almeno non senza sempre qualificare il termine), per i motivi che ho delineato sopra. Questa è una grande parte del motivo per cui penso che questa sia una domanda così importante: le persone a volte le chiamano non lineari, che penso vada bene finché siamo chiari su ciò che chiamiamo non lineare, dal momento che non è il modo più convenzionale per fare riferimento ai modelli: quando sfidiamo la convenzione, dovremmo farlo attentamente e deliberatamente.
Glen_b -Restate Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.