Modello lineare generale vs. modello lineare generalizzato (con una funzione di collegamento identità?)


25

Questo è il mio primo post, quindi per favore, prenditela comoda se non seguo alcuni standard! Ho fatto una ricerca per la mia domanda e non è emerso nulla.

La mia domanda riguarda principalmente le differenze pratiche tra modellistica lineare generale (GLM) e modellistica lineare generalizzata (GZLM). Nel mio caso sarebbero alcune variabili continue come covariate e alcuni fattori in un ANCOVA, contro GZLM. Voglio esaminare i principali effetti di ciascuna variabile, nonché un'interazione a tre vie che tratterò nel modello. Vedo questa ipotesi essere testata in un ANCOVA o usando GZLM. In una certa misura capisco i processi matematici e il ragionamento alla base dell'esecuzione di un modello lineare generale come un ANCOVA, e in qualche modo capisco che i GZLM consentono una funzione di collegamento che collega il modello lineare e la variabile dipendente (ok, ho mentito, forse no capisco davvero la matematica). Quello che davvero non faccio Comprendere sono le differenze pratiche o le ragioni per eseguire un'analisi e non l'altra quando la distribuzione di probabilità utilizzata nella GZLM è normale (cioè, funzione di collegamento di identità?). Ottengo risultati molto diversi quando corro l'uno sull'altro. Potrei correre neanche io? I miei dati sono in qualche modo non normali, ma funzionano in una certa misura sia in ANCOVA che in GZLM. In entrambi i casi la mia ipotesi è supportata, ma in GZLM il valore p è "migliore".

Il mio pensiero era che un ANCOVA sia un modello lineare con una variabile dipendente normalmente distribuita che utilizza una funzione di collegamento identità, che è esattamente ciò che posso inserire in un GZLM, ma questi sono ancora diversi.

Per favore fai un po 'di luce su queste domande per me, se puoi!


Sulla base della prima risposta ho la domanda aggiuntiva:

Se sono identici, tranne per il test di significatività che ha utilizzato (cioè, test F vs. Wald Chi Square), quale sarebbe più appropriato usare? ANCOVA è il "metodo di partenza", ma non sono sicuro del motivo per cui il test F sarebbe preferibile. Qualcuno può fare luce su questa domanda per me? Grazie!


tF

Risposte:


23

Un modello lineare generalizzato che specifica una funzione di collegamento di identità e una normale distribuzione familiare è esattamente equivalente a un modello lineare (generale). Se stai ottenendo risultati notevolmente diversi da ciascuno, stai facendo qualcosa di sbagliato.

Si noti che specificando un collegamento identità non equivale a specificare una distribuzione normale. La distribuzione e la funzione di collegamento sono due diversi componenti del modello lineare generalizzato e ciascuno può essere scelto indipendentemente dall'altro (sebbene alcuni collegamenti funzionino meglio con determinate distribuzioni, quindi la maggior parte dei pacchetti software specifica la scelta dei collegamenti consentiti per ciascuna distribuzione).

Alcuni pacchetti software potrebbero essere notevolmente diversi pptFtF sono rigorosamente valide solo per la famiglia normale, anche se alcune altre il software per i modelli lineari generalizzati può anche usarli come approssimazioni quando si adattano altre famiglie con un parametro di scala stimato dai dati.


Grazie per la risposta! Sono contento di sentire la tua risposta, poiché questa era la mia ipotesi originale. Mi è stato detto altrimenti da un professore della mia istituzione, quindi ho dovuto davvero scavare. Sto usando SPSS e ora vedo che le stime dei parametri sono effettivamente identiche (ad es. Valori B). Vedo ora che ciò che mi aveva confuso originariamente erano i diversi valori di p. La statistica ANCOVA si basa su un test F standard, mentre la GZLM si basa sul Wald Chi-Square, giusto? Ho letto che il Wald Chi-Square viene utilizzato quando si utilizzano i parametri del campione (come nel GZLM).
Behacad,

Sulla base di questa risposta, ho aggiunto una domanda al post originale!
Behacad,

Ok, ho aggiunto un para corrispondente alla mia risposta in risposta.
onestop,

5

Vorrei includere la mia esperienza in questa discussione. Ho visto che un modello lineare generalizzato (che specifica una funzione di collegamento di identità e una normale distribuzione familiare) è identico a un modello lineare generale solo quando si utilizza la stima della massima verosimiglianza come metodo di parametro di scala. Altrimenti se si sceglie "valore fisso = 1" come metodo di parametro di scala si ottengono valori p molto diversi. La mia esperienza suggerisce che di solito "valore fisso = 1" dovrebbe essere evitato. Sono curioso di sapere se qualcuno sa quando è appropriato scegliere il valore fisso = 1 come metodo del parametro di scala. Grazie in anticipo. marchio


3
In genere si utilizza una scala fissa solo con modelli come la regressione logistica o la regressione di Poisson, in cui la risposta è un conteggio o una variabile indicatore / frequenza. In questo caso non esiste un analogo al parametro scale nella regressione normale.
Hong Ooi,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.