Non sono nemmeno sicuro che la domanda abbia molto senso, ma penso di aver visto un paio di titoli di articoli in cui proponevano foreste casuali con effetti casuali. È possibile in R?
Non sono nemmeno sicuro che la domanda abbia molto senso, ma penso di aver visto un paio di titoli di articoli in cui proponevano foreste casuali con effetti casuali. È possibile in R?
Risposte:
Non sono comunemente usati insieme e bisogna fare attenzione prima di combinarli.
Le foreste casuali sono in genere utilizzate come classificatori. Il motivo per cui dovresti usare una foresta casuale invece di un altro metodo (ad esempio K-significa raggruppare) è che potresti avere un gran numero di dimensioni che vuoi classificare. Il problema di avere un gran numero di dimensioni è che se si volesse testare tutte le combinazioni di ordini di dimensioni, si avrebbe un gran numero di scelte (cresce più velocemente del numero di dimensioni fattoriale).
Gli effetti casuali vengono generalmente utilizzati in regressione con misure ripetute della stessa cosa. Sono comunemente usati nei modelli di effetti misti in cui il termine misto si riferisce a effetti sia fissi che casuali. Si pensa che gli effetti fissi rappresentino i parametri che rivedrai (ad es. Un farmaco o l'età di una persona). Si pensa che gli effetti casuali rappresentino un'istanza di variabilità attorno a un parametro che non si vedrà più (ad es. Una persona specifica).
Ci sono esempi che li usano insieme quando ci sono dati raggruppati http://dx.doi.org/10.1080/00949655.2012.741599 e http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf .
Non sono a conoscenza di alcun pacchetto R in grado di eseguire questa analisi.
Sì è possibile È necessario controllare " Alberi RE-EM: un approccio di data mining per i dati longitudinali e raggruppati " e il pacchetto R associato REEMtree .
È da un po 'che non guardo il giornale. Ricordo che gli autori non avevano ancora provato a formare gruppi di questi alberi, ma che nulla suggeriva che non avrebbe funzionato.
Le foreste casuali a effetti misti (MERF) sono una cosa. Come afferma la risposta sopra, ci sono alcune grandi ricerche su di loro dal gruppo del Dr. Larocque all'HEC di Montreal. L'articolo è qui: http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599 .
Essenzialmente è un modo teoricamente valido per combinare la modellazione non lineare di foreste casuali con effetti casuali lineari.
Abbiamo appena rilasciato un pacchetto open source in Python che implementa MERF usando l'algoritmo sopra riportato nel documento.
Abbiamo scritto un post dettagliato sul blog sul pacchetto e su come utilizzarlo per set di dati in cluster.