Trasmissione di un modello lineare multivariato come regressione multipla


20

Riformare un modello di regressione lineare multivariata come regressione lineare multipla è del tutto equivalente? Non mi riferisco semplicemente correre regressioni separate.t

Ho letto questo in alcuni punti (Bayesian Data Analysis - Gelman et al. E Multivariate Old School - Marden) che un modello lineare multivariato può essere facilmente parametrizzato come regressione multipla. Tuttavia, nessuna delle due fonti lo elabora affatto. Fondamentalmente lo menzionano, quindi continuano a usare il modello multivariato. Matematicamente, scriverò prima la versione multivariata,

Yn×t=Xn×kBk×t+Rn×t,
dove le variabili in grassetto sono matrici con le loro dimensioni al di sotto di esse. Come al solito, sono dati, è la matrice di progettazione, sono normalmente residui distribuiti e è ciò con cui siamo interessati a fare inferenze.X R BYXRB

Per riclassificare questo come la familiare regressione lineare multipla, si riscrivono semplicemente le variabili come:

ynt×1=Dnt×nkβnk×1+rnt×1,

dove le riparazioni utilizzate sono y=row(Y) , β=row(B) e D=Xion . row() significa che le righe della matrice sono disposte da un capo all'altro in un vettore lungo e è il prodotto kronecker o esterno.

Quindi, se è così facile, perché preoccuparsi di scrivere libri su modelli multivariati, testare statistiche per loro ecc.? È molto efficace trasformare prima le variabili e utilizzare tecniche univariate comuni. Sono sicuro che ci sia una buona ragione, sto solo facendo fatica a pensare a uno, almeno nel caso di un modello lineare. Esistono situazioni con il modello lineare multivariato e errori casuali normalmente distribuiti in cui questa reparameterizzazione non si applica o limita le possibilità dell'analisi che è possibile effettuare?

Fonti Ho visto questo: Marden - Statistiche multivariate: Old School. Vedere le sezioni 5.3 - 5.5. Il libro è disponibile gratuitamente da: http://istics.net/stat/

Gelman et al. - Analisi dei dati bayesiani. Ho la seconda edizione e in questa versione c'è un piccolo paragrafo nel cap. 19 "Modelli di regressione multivariata" dal titolo: "Il modello di regressione univariato equivalente"

Fondamentalmente, puoi fare tutto con il modello di regressione univariata lineare equivalente che potresti con il modello multivariato? In tal caso, perché sviluppare metodi per modelli lineari multivariati?

Che dire degli approcci bayesiani?


È una buona domanda Forse potresti chiedere di più in termini di basi piuttosto che di una struttura.
Subhash C. Davar,

1
Cosa intendi per base piuttosto che struttura? Potresti elaborare?
bill_e

Posso notare che ho appreso solo due articoli come parte del mio primo e post-laurea, non ho cura delle descrizioni tecniche. Comprendo che l'analisi multivariata ha ipotesi diverse rispetto a una regressione lineare multipla o semplicemente a un modello di regressione lineare. I presupposti per l'analisi multivariata sono diversi, ovvero prevale l'attesa matematica. la regressione lineare multipla fa alcune altre ipotesi che si traducono in eteroscedatismo. La struttura qui intendo si riferisce alle tue equazioni.
Subhash C. Davar,

Dovresti dire chiaramente nel titolo o all'inizio se stai parlando di un modello lineare (generale) multivariato o di regressione multivariata bayesiana .
ttnphns,

1
Ok, quindi .. non è il mio approccio, ho indicato due posti in cui l'ho visto. L'approccio è il nocciolo del problema. Qual è la differenza tra la versione multivariata e la versione univariata riparata?
bill_e

Risposte:


5

Fondamentalmente, puoi fare tutto con il modello di regressione univariata lineare equivalente che potresti con il modello multivariato?

Credo che la risposta sia no.

Se il tuo obiettivo è semplicemente quello di stimare gli effetti (parametri in ) o di fare ulteriori previsioni in base al modello, allora sì, non importa adottare quale formulazione del modello tra i due.B

Tuttavia, per fare inferenze statistiche soprattutto per eseguire i test di significatività classica, la formulazione multivariata sembra praticamente insostituibile. Più specificamente permettetemi di usare la tipica analisi dei dati in psicologia come esempio. I dati di soggetti sono espressi comen

Yn×t=Xn×kBk×t+Rn×t,

dove le variabili esplicative tra soggetti (fattore o / e covariate quantitative) sono codificate come colonne in mentre i livelli di misure ripetute (o all'interno del soggetto) sono rappresentati come variabili simultanee o il colonne in .k1XtY

Con la formulazione di cui sopra, qualsiasi ipotesi lineare generale può essere facilmente espressa come

LBM=C,

dove è composto dai pesi tra le variabili esplicative tra soggetti mentre contiene i pesi tra i livelli dei fattori di misure ripetute e è una matrice costante, solitamente .LLC0

La bellezza del sistema multivariato sta nella sua separazione tra i due tipi di variabili, tra e all'interno del soggetto. È questa separazione che consente la facile formulazione di tre tipi di test di significatività nel quadro multivariato: il test multivariato classico, il test multivariato a misure ripetute e il test univariato a misure ripetute. Inoltre, i test di Mauchly per la violazione della sfericità e i corrispondenti metodi di correzione (Greenhouse-Geisser e Huynh-Feldt) diventano anche naturali per i test univariati nel sistema multivariato. Questo è esattamente il modo in cui i pacchetti statistici hanno implementato quei test come auto in R, GLM in IBM SPSS Statistics e dichiarazione REPEATED in PROC GLM di SAS.

Non sono così sicuro che la formulazione sia importante nell'analisi dei dati bayesiani, ma dubito che la capacità di test sopra descritta possa essere formulata e implementata sotto la piattaforma univariata.


Vedo, questo ha senso. Grazie per l'ottima risposta. Mi piacerebbe anche ascoltare una prospettiva bayesiana.
bill_e

@PeterRabbit Se ti piace la risposta, ti preghiamo di esprimere la tua gratitudine a bluepole accettando la sua risposta. Riceverà punti.
pteetor,

Lo farò, stavo solo tendendo un po 'per vedere se qualcuno avrebbe offerto una prospettiva bayesiana.
bill_e,

4

Entrambi i modelli sono equivalenti se si adatta la struttura varianza-covarianza appropriata. Nel modello lineare trasformato dobbiamo adattare la matrice varianza-covarianza del componente errore con il prodotto kronecker che ha una disponibilità limitata nei software di elaborazione disponibili. Teoria dei modelli lineari: modelli univariati, multivariati e misti è un riferimento eccellente per questo argomento.

Modificato

Ecco un altro bel riferimento liberamente disponibile.


2
Oh ok, quindi in un normale modello univariato, non esiste alcun tipo di struttura di covarianza "all'interno" dei DV. Pertanto, non esistono test di ipotesi relativi a ciò. Grazie! Vedrò se posso prendere quel libro.
bill_e
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.