Sto cercando di creare un modello ridotto per prevedere molte variabili dipendenti (DV) (~ 450) che sono altamente correlate.
Le mie variabili indipendenti (IV) sono anche numerose (~ 2000) e altamente correlate.
Se utilizzo il lazo per selezionare singolarmente un modello ridotto per ciascun output, non sono garantito che ottenga lo stesso sottoinsieme di variabili indipendenti che eseguo il ciclo su ciascuna variabile dipendente.
Esiste una regressione lineare multivariata che utilizza il lazo in R?
Questo non è un lazo di gruppo. gruppo lazo raggruppa il IV. Voglio una regressione lineare multivariata (il che significa che il DV è una matrice, non un vettore di scalari), che implementa anche il lazo. (Nota: come sottolinea NRH, questo non è vero. Il lazo di gruppo è un termine generale che include strategie che raggruppano il IV, ma includono anche strategie che raggruppano altri parametri come il DV)
Ho trovato questo documento che entra in qualcosa chiamato Sparse Overlapping Sets Lasso
Ecco un codice che esegue la regressione lineare multivariata
> dim(target)
[1] 6060 441
> dim(dictionary)
[1] 6060 2030
> fit = lm(target~dictionary)
Ecco del codice che esegue il lazo su un singolo DV
> fit = glmnet(dictionary, target[,1])
E questo è quello che vorrei fare:
> fit = glmnet(dictionary, target)
Error in weighted.mean.default(y, weights) :
'x' and 'w' must have the same length
Selezione di funzionalità che si adattano a TUTTI gli obiettivi contemporaneamente
glmnet
e ha una vignetta approfondita.