Le tecniche di regolarizzazione possono (dovrebbero?) Essere usate in un modello a effetti casuali?


11

Con le tecniche di regolarizzazione mi riferisco al lazo, alla regressione della cresta, alla rete elastica e simili.

Prendere in considerazione un modello predittivo sui dati sanitari contenenti dati demografici e diagnostici in cui è prevista la durata del soggiorno per degenza. Per alcuni individui ci sono più osservazioni LOS (cioè più di un episodio di PI) durante il periodo di tempo di base che sono correlate.

Ha senso costruire, ad esempio, un modello predittivo netto elastico che contiene un termine di intercettazione dell'effetto casuale per ciascun individuo?


Sottotitoli per la tua prima riga: "Con tecniche di effetti casuali (ovvero ipotesi su come un parametro viene distribuito casualmente) Mi riferisco ai priori di Laplace e ai priori normali sui parametri di regressione ... e simili" :-)
conjugateprior

Risposte:


7

Ci sono alcuni documenti che trattano questa domanda. Vorrei cercare in nessun ordine speciale:

  1. Pen.LME: Howard D Bondell, Arun Krishna e Sujit K Ghosh. Selezione variabile congiunta per eetti fissi e casuali in modelli lineari a eetti misti. Biometria, 66 (4): 1069-1077, 2010.

  2. GLMMLASSO: Jurg Schelldorfer, Peter Buhlmann, Sara van de Geer. Stima per modelli lineari a eetti misti ad alta dimensione utilizzando la penalizzazione L1. Scandinavian Journal of Statistics, 38 (2): 197-214, 2011.

che può essere trovato online.

Mi è capitato di finire un documento sull'applicazione di una penalità netta elastica al modello misto (LMMEN) ora e ho intenzione di inviarlo per la revisione del diario nel prossimo mese.

  1. LMMEN: Sidi, Ritov, Unger. Regolarizzazione e classificazione dei modelli misti lineari tramite la penalità della rete elastica

Soprattutto, se stai modellando dati che non sono normali o non hanno un collegamento di identità, andrei con GLMMLASSO, (ma attenzione che non può gestire molte RE). Altrimenti Pen.LME è buono dato che non si hanno dati altamente correlati, sia negli effetti fissi che casuali. In quest'ultimo caso puoi scrivermi e sarei felice di inviarti codice / carta (lo metterò su cran nel prossimo futuro).

Ho caricato su CRAN oggi - mmmen . Risolve il problema del modello misto lineare con una penalità di tipo rete elastica sugli effetti fissi e casuali contemporaneamente.

Nel pacchetto sono inoltre presenti funzioni cv per i pacchetti lmmlasso e glmmLasso .


1
Yonicd, l'applicazione della rete elastica ai modelli misti lineari è esattamente quello che sto cercando. Sto lavorando con dati genetici che sono correlati, quindi la selezione raggruppata di una rete elastica sarebbe molto utile. Ho provato a contattarti, ma non trovo altro che pubblicare questa risposta, poiché sembra impossibile inviare un messaggio. In ogni caso, non vedo l'ora di leggere il tuo documento e proverò il tuo codice non appena sarà disponibile.

5

Ho sempre visto la regressione della cresta solo come modelli di effetti casuali empirici non limitati a una singola variabile categoriale (e nessuna matrice di correlazione elaborata). Puoi quasi sempre ottenere le stesse previsioni convalidando in modo incrociato una penalità di cresta e adattando / stimando un semplice effetto casuale. Nel tuo esempio, potresti essere fantasioso e avere una penalità di cresta separata sulle funzionalità demo / diag e un'altra sugli indicatori del paziente (usando una linea in cui il fattore di ridimensionamento della penalità glmnet). In alternativa, potresti includere un effetto casuale fantasia che ha effetti correlati al tempo per persona. Nessuna di queste possibilità è giusta o sbagliata, sono solo utili.


2

Attualmente sto pensando a una domanda simile. Penso che nell'applicazione, puoi farlo se funziona e ritieni che l'utilizzo di questo sia ragionevole. Se si tratta di un'impostazione normale in effetti casuali (ciò significa che hai ripetute misurazioni per ciascun gruppo), allora si tratta solo di una tecnica di stima, che è meno controversa. Se in realtà non hai molte misurazioni ripetute per la maggior parte dei gruppi, allora potrebbe trovarsi al limite del solito modello di effetti casuali e potresti voler giustificare attentamente la sua validità (dal punto di vista metodologico) se vuoi proporlo come generale metodo.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.