Devo adattare una distribuzione gaussiana generalizzata a una nuvola di punti 7-dim contenente un numero piuttosto significativo di valori anomali con leva elevata. Conosci qualche buon pacchetto R per questo lavoro?
Devo adattare una distribuzione gaussiana generalizzata a una nuvola di punti 7-dim contenente un numero piuttosto significativo di valori anomali con leva elevata. Conosci qualche buon pacchetto R per questo lavoro?
Risposte:
C'è anche mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html
Un avvertimento, tuttavia: la modellazione della miscela in uno spazio ad alta dimensione può richiedere una notevole quantità di CPU e memoria se la nuvola di punti è grande. Circa quattro anni fa stavo realizzando un batch di dati a 11 dimensioni, 50-200K punti, e tendeva a finire in 4-11 GB di RAM e impiegare fino a una settimana per calcolare per ogni caso (e ne avevo 400). Questo è certamente possibile, ma può essere un mal di testa se stai usando un cluster di calcolo condiviso o hai risorse limitate disponibili.
Sembra un classico modello di miscela gaussiana multivariata. Penso che il pacchetto BayesM potrebbe funzionare.
Ecco alcuni pacchetti multivariati di miscele gaussiane