Statistiche e Big Data euclidean

7

La distanza euclidea di solito non è buona per i dati sparsi?

Ho visto da qualche parte che le distanze classiche (come la distanza euclidea) diventano debolmente discriminanti quando abbiamo dati multidimensionali e radi. Perché? Hai un esempio di due vettori di dati sparsi in cui la distanza euclidea non funziona bene? In questo caso quale somiglianza dovremmo usare?

72 machine-learning clustering data-mining sparse euclidean

6

Perché l'algoritmo di clustering k-mean usa solo la metrica della distanza euclidea?

Esiste uno scopo specifico in termini di efficienza o funzionalità perché l'algoritmo k-mean non utilizza ad esempio la cosine (dis) somiglianza come metrica della distanza, ma può usare solo la norma euclidea? In generale, il metodo K-mean sarà conforme e sarà corretto quando verranno prese in considerazione o utilizzate distanze …

62 clustering k-means distance-functions euclidean

2

La somiglianza del coseno è identica alla distanza euclidea normalizzata l2?

Identico significato, che produrrà risultati identici per una somiglianza Classifica tra un vettore u e un insieme di vettori V . Ho un modello di spazio vettoriale che ha come parametro la misura della distanza (distanza euclidea, somiglianza del coseno) e la tecnica di normalizzazione (nessuna, l1, l2). Da quanto …

27 normalization natural-language euclidean cosine-distance cosine-similarity

1

Conversione della matrice di somiglianza in matrice di distanza (euclidea)

Nell'algoritmo della foresta casuale, Breiman (autore) costruisce una matrice di somiglianza come segue: Invia tutti gli esempi di apprendimento giù per ogni albero nella foresta Se due esempi arrivano alla stessa foglia incrementano l'elemento corrispondente nella matrice di somiglianza di 1 Normalizza la matrice con il numero di alberi Lui …

27 random-forest distance similarities euclidean

5

Come posso convertire la distanza (euclidea) in punteggio di somiglianza

Sto usando kkk significa raggruppare per raggruppare le voci dei relatori. Quando confronto un'enunciazione con i dati degli altoparlanti raggruppati ottengo una distorsione media (basata sulla distanza euclidea). Questa distanza può essere nell'intervallo di [0,∞][0,∞][0,\infty] . Voglio convertire questa distanza in un punteggio di somiglianza [0,1][0,1][0,1] . Per favore guidami …

13 clustering k-means distance euclidean

1

Pro della distanza Jeffries Matusita

Secondo alcuni articoli che sto leggendo, la distanza di Jeffries e Matusita è comunemente usata. Ma non sono riuscito a trovare molte informazioni su di esso ad eccezione della formula seguente JMD (x, y) =∑(xi−−√2−yi−−√2)2−−−−−−−−−−−−−√2∑(xi2−yi2)22\sqrt[2]{\sum(\sqrt[2]{x_i}-\sqrt[2]{y_i})^2} È simile alla distanza euclidea ad eccezione della radice quadrata E (x, y) =∑(xi−yi)2−−−−−−−−−−√2∑(xi−yi)22\sqrt[2]{\sum(x_i-y_i)^2} La …

11 classification k-nearest-neighbour euclidean

3

Quale distanza usare? ad esempio, manhattan, euclideo, Bray-Curtis, ecc

Non sono un ecologo della comunità, ma in questi giorni sto lavorando su dati di ecologia della comunità. Ciò che non riuscivo a capire, a parte la matematica di queste distanze, sono i criteri per ciascuna distanza da utilizzare e in quali situazioni può essere applicata. Ad esempio, cosa utilizzare …

11 distance euclidean

1

Perché Anova () e drop1 () hanno fornito risposte diverse per i GLMM?

Ho un GLMM del modulo: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), ottengo risultati diversi rispetto a quelli che utilizzo Anova(model, type="III")dal pacchetto auto o summary(model). Questi ultimi due danno le stesse risposte. Usando un mucchio di dati fabbricati, …

10 r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

1

La mia rete neurale non può nemmeno imparare la distanza euclidea

Quindi sto cercando di insegnare a me stesso le reti neurali (per applicazioni di regressione, non classificare immagini di gatti). I miei primi esperimenti sono stati l'addestramento di una rete per implementare un filtro FIR e una trasformata discreta di Fourier (addestramento sui segnali "prima" e "dopo"), dal momento che …

9 machine-learning neural-networks optimization keras euclidean

Domande taggate «euclidean»