Risposte:
Il nome è un po 'improprio. I modelli log-lineari venivano tradizionalmente utilizzati per l'analisi dei dati in un formato di tabella di contingenza. Sebbene i "dati di conteggio" non debbano necessariamente seguire una distribuzione di Poisson, il modello log-lineare è in realtà solo un modello di regressione di Poisson. Da qui il nome "log" (i modelli di regressione di Poisson contengono una funzione di collegamento "log").
Una "variabile di risultato trasformata in log" in un modello di regressione lineare non è un modello log-lineare (né una variabile di risultato esponenziata, come suggerirebbe "log-linear"). Sia i modelli log-linear che le regressioni logistiche sono esempi di modelli lineari generalizzati , in cui la relazione tra un predittore lineare (come odds-log o rate-log) è lineare nelle variabili del modello. Non sono "modelli di regressione lineare semplice" (o modelli che utilizzano il solito formato ).
Nonostante tutto, è possibile ottenere un'inferenza equivalente sulle associazioni tra variabili categoriali usando la regressione logistica e la regressione di Poisson. È solo che nel modello di Poisson, le variabili di risultato sono trattate come covariate. È interessante notare che è possibile impostare alcuni modelli che prendono in prestito informazioni tra i gruppi in un modo molto simile a un modello di probabilità proporzionale, ma questo non è ben compreso e raramente utilizzato.
Esempi di ottenere inferenza equivalente nei modelli di regressione logistica e di poisson usando R illustrato di seguito:
y <- c(0, 1, 0, 1)
x <- c(0, 0, 1, 1)
w <- c(10, 20, 30, 40)
## odds ratio for relationship between x and y from logistic regression
glm(y ~ x, family=binomial, weights=w)
## the odds ratio is the same interaction parameter between contingency table frequencies
glm(w ~ y * x, family=poisson)
Non credo che definirei nessuno dei due un "semplice modello di regressione lineare". Sebbene sia possibile utilizzare il log o le trasformazioni logit come funzione di collegamento per un numero di modelli diversi, questi sono generalmente intesi come riferimenti a modelli specifici. Ad esempio, "regressione logistica" è inteso come un modello lineare generalizzato (GLiM) per situazioni in cui la variabile di risposta è distribuita come binomiale . Inoltre, la "regressione log-lineare" è generalmente intesa come GLiM Poisson applicata alle tabelle di contingenza a più vie. In altre parole, oltre al fatto che sono entrambi modelli di regressione / GLiM, non li vedo necessariamente come molto simili (ci sono alcune connessioni tra loro, come sottolinea @AdamO, ma gli usi tipici sono abbastanza distinti). La differenza più grande sarebbe che la regressione logistica presuppone che la risposta sia distribuita come binomiale e che la regressione log-lineare presupponga che la risposta sia distribuita come Poisson . In effetti, la regressione log-lineare è piuttosto diversa dalla maggior parte dei modelli di regressione in quanto la variabile di risposta non è in realtà una delle tue variabili (nel senso comune), ma piuttosto l'insieme dei conteggi di frequenza associati alle combinazioni delle tue variabili nella tabella di contingenza multidirezionale.