Quando utilizzare il modello di miscela gaussiana?


9

Sono nuovo di usare GMM. Non sono stato in grado di trovare alcun aiuto appropriato online. Qualcuno potrebbe fornirmi la giusta risorsa su "Come decidere se l'utilizzo di GMM si adatta al mio problema?" o in caso di problemi di classificazione "Come decidere se devo usare la classificazione SVM o la classificazione GMM?"


qual è il tuo set di dati e qual è il tuo problema esatto? Viene utilizzato quando i dati seguono (è una miscela di) più di 1 distribuzione normale. Visualizza un'altra domanda - stats.stackexchange.com/questions/236295/…
Arpit Sisodia,

Puoi pensarlo come una forma di clustering in cui non hai dati etichettati e credi che i raggruppamenti latenti siano perfettamente multivariati normali.
gung - Ripristina Monica

@ arpit-sisodia, Stiamo lavorando alla fattibilità di una configurazione della tastiera hardware che sembra avere caratteristiche specifiche e stiamo pianificando di modellarla usando GMM. Non conosciamo chiaramente il processo sottostante e quindi stiamo provando a modellare usando metodi di apprendimento automatico. Quindi, non siamo sicuri che ci sia effettivamente una miscela di gaussiani nel processo sottostante. Inoltre, è multidimensionale e non possiamo visualizzarlo per vedere se è una miscela di gaussiani
Vinay

@ arpit-sisodia, Link che hai fornito suggerisce ulteriori metodi di prova ed errore per vedere se GMM si adatta ai miei dati. Esiste un modo conclusivo / regola del pollice per decidere i modelli da utilizzare. Il metodo di prova ed errore di giocare con più miscele può adattarsi ai miei dati. Ma c'è un certo modo di decidere? Come se avessimo bisogno di una separabilità lineare dei dati per la classificazione SVM
Vinay,

Risposte:


4

Secondo me, puoi eseguire GMM quando sai che i punti dati sono miscele di una distribuzione gaussiana. Fondamentalmente formando cluster con media diversa e deviazione standard. C'è un bel diagramma sul sito web di scikit-learn. L

Classificazione GMM

Un approccio consiste nel trovare i cluster utilizzando metodi di clustering soft e quindi vedere se sono gaussiani. In tal caso, è possibile applicare un modello GMM che rappresenta l'intero set di dati.


1
spesso non sappiamo se i punti dati siano una miscela di gaussiani. Quindi, questo è più un gioco con Gaussian e MoG e vedere se si adatta. Ma non ci sono indicazioni / regole da seguire per usare GMM a destra
Vinay,

2
Secondo la mia esperienza, devi trovare lo schema nei dati che è un modello Mixture. Un bel documento da leggere sarebbe questo: stat.cmu.edu/~cshalizi/uADA/12/lectures/ch20.pdf
Cacciatrice

0

Gli GMM sono in genere un buon punto di partenza se il tuo obiettivo è (1) osservazioni di gruppo, (2) specificare un modello generativo o (3) stimare le densità. In effetti, per il clustering, gli MGM sono un superset di k-medie.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.