Ho un set di dati X che ha 10 dimensioni, 4 delle quali sono valori discreti. In effetti, quelle 4 variabili discrete sono ordinali, ovvero un valore più alto implica un semantico più alto / migliore. 2 di queste variabili discrete sono categoriche nel senso che per ciascuna di queste …
Sto leggendo Bishop sull'algoritmo EM per GMM e la relazione tra GMM e k-mean. In questo libro si dice che k-mean è una versione difficile di GMM. Mi chiedo questo implica che se i dati che sto cercando di raggruppare non sono gaussiani, non posso usare k-mean (o almeno non …
Voglio implementare l'algoritmo EM manualmente e poi confrontarlo con i risultati normalmixEMdel mixtoolspacchetto. Certo, sarei felice se entrambi conducessero agli stessi risultati. Il riferimento principale è Geoffrey McLachlan (2000), Modelli di miscele finite . Ho una densità mista di due gaussiani, in forma generale, la probabilità di log è data …
Considera la probabilità di log di una miscela di gaussiani: l(Sn;θ)=∑t=1nlogf(x(t)|θ)=∑t=1nlog{∑i=1kpif(x(t)|μ(i),σ2i)}l(Sn;θ)=∑t=1nlogf(x(t)|θ)=∑t=1nlog{∑i=1kpif(x(t)|μ(i),σi2)}l(S_n; \theta) = \sum^n_{t=1}\log f(x^{(t)}|\theta) = \sum^n_{t=1}\log\left\{\sum^k_{i=1}p_i f(x^{(t)}|\mu^{(i)}, \sigma^2_i)\right\} Mi chiedevo perché era difficile dal punto di vista computazionale massimizzare quell'equazione direttamente? Stavo cercando una chiara intuizione solida sul perché dovrebbe essere ovvio che è difficile o forse una spiegazione …
Ci sono molte pubblicazioni che enfatizzano il metodo di massimizzazione delle aspettative su modelli di miscele (Miscela di gaussiana, modello nascosto di Markov, ecc.). Perché EM è importante? EM è solo un modo per fare l'ottimizzazione e non è ampiamente usato come metodo basato sul gradiente (gradiente decente o metodo …
Ho due variabili: X e Y e ho bisogno di rendere il cluster massimo (e ottimale) = 5. Facciamo un diagramma ideale delle variabili come il seguente: Vorrei creare 5 cluster di questo. Qualcosa come questo: Quindi penso che questo sia un modello misto con 5 cluster. Ogni cluster ha …
I test di permutazione (chiamati anche test di randomizzazione, test di ri-randomizzazione o test esatto) sono molto utili e sono utili quando l'assunzione della distribuzione normale richiesta da per esempio t-testnon è soddisfatta e quando la trasformazione dei valori per classifica del test non parametrici come Mann-Whitney-U-testquesto porterebbero alla perdita …
Nel capitolo 9 del libro Riconoscimento dei modelli e apprendimento automatico, c'è questa parte sul modello di miscela gaussiana: Ad essere sincero, non capisco davvero perché questo creerebbe una singolarità. Qualcuno può spiegarmi questo? Mi dispiace ma sono solo un laureando e un principiante nell'apprendimento automatico, quindi la mia domanda …
I modelli di miscele gaussiane (GMM) sono allettanti perché sono semplici da lavorare sia in termini analitici che pratici e sono in grado di modellare alcune distribuzioni esotiche senza troppa complessità. Ci sono alcune proprietà analitiche che dovremmo aspettarci di possedere che non sono chiare in generale. In particolare: Supponiamo …
So che una somma di gaussiani è gaussiana. Quindi, in che cosa differisce un miscuglio di gaussiani? Voglio dire, una miscela di gaussiani è solo una somma di gaussiani (dove ogni gaussiano è moltiplicato per il rispettivo coefficiente di miscelazione) giusto?
Mentre provavo qui i modelli di miscele gaussiane , ho trovato questi 4 tipi di covarianze. 'full' (each component has its own general covariance matrix), 'tied' (all components share the same general covariance matrix), 'diag' (each component has its own diagonal covariance matrix), 'spherical' (each component has its own single …
Ho informazioni sulle distribuzioni di dimensioni antropometriche (come l'arco di spalla) per bambini di età diverse. Per ogni età e dimensione, ho una deviazione media e standard. (Ho anche otto quantili, ma non credo che sarò in grado di ottenere ciò che voglio da loro.) Per ogni dimensione, vorrei stimare …
Il pacchetto R mclustutilizza BIC come criterio per la selezione del modello di cluster. Secondo la mia comprensione, un modello con il BIC più basso dovrebbe essere selezionato rispetto ad altri modelli (se ti interessa solo il BIC). Tuttavia, quando i valori BIC sono tutti negativi, la Mclustfunzione passa automaticamente …
Il mgcvpacchetto per Rha due funzioni per adattare le interazioni del prodotto tensore: te()e ti(). Comprendo la divisione di base del lavoro tra i due (adattamento di un'interazione non lineare rispetto alla scomposizione di questa interazione in effetti principali e un'interazione). Quello che non capisco è perché te(x1, x2)e ti(x1) …
Sto eseguendo una rapida simulazione per confrontare diversi metodi di clustering e attualmente ho un problema cercando di valutare le soluzioni del cluster. Conosco varie metriche di convalida (molte delle quali si trovano in cluster.stats () in R), ma presumo che siano meglio utilizzate se il numero stimato di cluster …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.