Statistiche e Big Data gaussian-mixture

5

Clustering di un set di dati con variabili sia discrete che continue

Ho un set di dati X che ha 10 dimensioni, 4 delle quali sono valori discreti. In effetti, quelle 4 variabili discrete sono ordinali, ovvero un valore più alto implica un semantico più alto / migliore. 2 di queste variabili discrete sono categoriche nel senso che per ciascuna di queste …

33 clustering k-means discrete-data continuous-data gaussian-mixture

2

Se il clustering k-mean è una forma di modellizzazione della miscela gaussiana, può essere usato quando i dati non sono normali?

Sto leggendo Bishop sull'algoritmo EM per GMM e la relazione tra GMM e k-mean. In questo libro si dice che k-mean è una versione difficile di GMM. Mi chiedo questo implica che se i dati che sto cercando di raggruppare non sono gaussiani, non posso usare k-mean (o almeno non …

21 clustering data-mining k-means gaussian-mixture

2

Algoritmo EM implementato manualmente

Voglio implementare l'algoritmo EM manualmente e poi confrontarlo con i risultati normalmixEMdel mixtoolspacchetto. Certo, sarei felice se entrambi conducessero agli stessi risultati. Il riferimento principale è Geoffrey McLachlan (2000), Modelli di miscele finite . Ho una densità mista di due gaussiani, in forma generale, la probabilità di log è data …

20 r expectation-maximization gaussian-mixture

2

Perché ottimizzare un mix di gaussiano direttamente dal punto di vista computazionale?

Considera la probabilità di log di una miscela di gaussiani: l(Sn;θ)=∑t=1nlogf(x(t)|θ)=∑t=1nlog{∑i=1kpif(x(t)|μ(i),σ2i)}l(Sn;θ)=∑t=1nlog⁡f(x(t)|θ)=∑t=1nlog⁡{∑i=1kpif(x(t)|μ(i),σi2)}l(S_n; \theta) = \sum^n_{t=1}\log f(x^{(t)}|\theta) = \sum^n_{t=1}\log\left\{\sum^k_{i=1}p_i f(x^{(t)}|\mu^{(i)}, \sigma^2_i)\right\} Mi chiedevo perché era difficile dal punto di vista computazionale massimizzare quell'equazione direttamente? Stavo cercando una chiara intuizione solida sul perché dovrebbe essere ovvio che è difficile o forse una spiegazione …

18 machine-learning gaussian-mixture expectation-maximization

2

Perché l'ottimizzazione delle aspettative è importante per i modelli di miscele?

Ci sono molte pubblicazioni che enfatizzano il metodo di massimizzazione delle aspettative su modelli di miscele (Miscela di gaussiana, modello nascosto di Markov, ecc.). Perché EM è importante? EM è solo un modo per fare l'ottimizzazione e non è ampiamente usato come metodo basato sul gradiente (gradiente decente o metodo …

15 machine-learning optimization expectation-maximization gaussian-mixture

2

Come adattare il modello di miscela per il clustering

Ho due variabili: X e Y e ho bisogno di rendere il cluster massimo (e ottimale) = 5. Facciamo un diagramma ideale delle variabili come il seguente: Vorrei creare 5 cluster di questo. Qualcosa come questo: Quindi penso che questo sia un modello misto con 5 cluster. Ogni cluster ha …

15 r clustering gaussian-mixture

1

Qual è l'intuizione dietro i campioni scambiabili sotto l'ipotesi nulla?

I test di permutazione (chiamati anche test di randomizzazione, test di ri-randomizzazione o test esatto) sono molto utili e sono utili quando l'assunzione della distribuzione normale richiesta da per esempio t-testnon è soddisfatta e quando la trasformazione dei valori per classifica del test non parametrici come Mann-Whitney-U-testquesto porterebbero alla perdita …

15 hypothesis-testing permutation-test exchangeability r statistical-significance loess data-visualization normal-distribution pdf ggplot2 kernel-smoothing probability self-study expected-value normal-distribution prior correlation time-series regression heteroscedasticity estimation estimators fisher-information data-visualization repeated-measures binary-data panel-data mathematical-statistics coefficient-of-variation normal-distribution order-statistics regression machine-learning one-class probability estimators forecasting prediction validation finance measurement-error variance mean spatial monte-carlo data-visualization boxplot sampling uniform chi-squared goodness-of-fit probability mixture theory gaussian-mixture regression statistical-significance p-value bootstrap regression multicollinearity correlation r poisson-distribution survival regression categorical-data ordinal-data ordered-logit regression interaction time-series machine-learning forecasting cross-validation binomial multiple-comparisons simulation false-discovery-rate r clustering frequency wilcoxon-mann-whitney wilcoxon-signed-rank r svm t-test missing-data excel r numerical-integration r random-variable lme4-nlme mixed-model weighted-regression power-law errors-in-variables machine-learning classification entropy information-theory mutual-information

5

Problemi di singolarità nel modello di miscela gaussiana

Nel capitolo 9 del libro Riconoscimento dei modelli e apprendimento automatico, c'è questa parte sul modello di miscela gaussiana: Ad essere sincero, non capisco davvero perché questo creerebbe una singolarità. Qualcuno può spiegarmi questo? Mi dispiace ma sono solo un laureando e un principiante nell'apprendimento automatico, quindi la mia domanda …

15 gaussian-mixture

3

Riferimenti che giustificano l'uso di miscele gaussiane

I modelli di miscele gaussiane (GMM) sono allettanti perché sono semplici da lavorare sia in termini analitici che pratici e sono in grado di modellare alcune distribuzioni esotiche senza troppa complessità. Ci sono alcune proprietà analitiche che dovremmo aspettarci di possedere che non sono chiare in generale. In particolare: Supponiamo …

14 probability normal-distribution references gaussian-mixture information-theory

3

Relazione tra somma di camper gaussiani e miscela gaussiana

So che una somma di gaussiani è gaussiana. Quindi, in che cosa differisce un miscuglio di gaussiani? Voglio dire, una miscela di gaussiani è solo una somma di gaussiani (dove ogni gaussiano è moltiplicato per il rispettivo coefficiente di miscelazione) giusto?

13 normal-distribution random-variable mixture gaussian-mixture

1

Diversi tipi di covarianza per modelli di miscele gaussiane

Mentre provavo qui i modelli di miscele gaussiane , ho trovato questi 4 tipi di covarianze. 'full' (each component has its own general covariance matrix), 'tied' (all components share the same general covariance matrix), 'diag' (each component has its own diagonal covariance matrix), 'spherical' (each component has its own single …

13 covariance-matrix gaussian-mixture

1

Quantili dalla combinazione di distribuzioni normali

Ho informazioni sulle distribuzioni di dimensioni antropometriche (come l'arco di spalla) per bambini di età diverse. Per ogni età e dimensione, ho una deviazione media e standard. (Ho anche otto quantili, ma non credo che sarò in grado di ottenere ciò che voglio da loro.) Per ogni dimensione, vorrei stimare …

13 normal-distribution quantiles gaussian-mixture aggregation

1

Selezione del modello Mclust

Il pacchetto R mclustutilizza BIC come criterio per la selezione del modello di cluster. Secondo la mia comprensione, un modello con il BIC più basso dovrebbe essere selezionato rispetto ad altri modelli (se ti interessa solo il BIC). Tuttavia, quando i valori BIC sono tutti negativi, la Mclustfunzione passa automaticamente …

11 r clustering gaussian-mixture bic model-based-clustering

1

R / mgcv: Perché i prodotti tensor te () e ti () producono superfici diverse?

Il mgcvpacchetto per Rha due funzioni per adattare le interazioni del prodotto tensore: te()e ti(). Comprendo la divisione di base del lavoro tra i due (adattamento di un'interazione non lineare rispetto alla scomposizione di questa interazione in effetti principali e un'interazione). Quello che non capisco è perché te(x1, x2)e ti(x1) …

11 r gam mgcv conditional-probability mixed-model references bayesian estimation conditional-probability machine-learning optimization gradient-descent r hypothesis-testing wilcoxon-mann-whitney time-series bayesian inference change-point time-series anova repeated-measures statistical-significance bayesian contingency-tables regression prediction quantiles classification auc k-means scikit-learn regression spatial circular-statistics t-test effect-size cohens-d r cross-validation feature-selection caret machine-learning modeling python optimization frequentist correlation sample-size normalization group-differences heteroscedasticity independence generalized-least-squares lme4-nlme references mcmc metropolis-hastings optimization r logistic feature-selection separation clustering k-means normal-distribution gaussian-mixture kullback-leibler java spark-mllib data-visualization categorical-data barplot hypothesis-testing statistical-significance chi-squared type-i-and-ii-errors pca scikit-learn conditional-expectation statistical-significance meta-analysis intuition r time-series multivariate-analysis garch machine-learning classification data-mining missing-data cart regression cross-validation matrix-decomposition categorical-data repeated-measures chi-squared assumptions contingency-tables prediction binary-data trend test-for-trend matrix-inverse anova categorical-data regression-coefficients standard-error r distributions exponential interarrival-time copula log-likelihood time-series forecasting prediction-interval mean standard-error meta-analysis meta-regression network-meta-analysis systematic-review normal-distribution multiple-regression generalized-linear-model poisson-distribution poisson-regression r sas cohens-kappa

3

Distanza tra due miscele gaussiane per valutare le soluzioni a grappolo

Sto eseguendo una rapida simulazione per confrontare diversi metodi di clustering e attualmente ho un problema cercando di valutare le soluzioni del cluster. Conosco varie metriche di convalida (molte delle quali si trovano in cluster.stats () in R), ma presumo che siano meglio utilizzate se il numero stimato di cluster …

11 clustering kullback-leibler gaussian-mixture

Domande taggate «gaussian-mixture»