Statistiche e Big Data similarities

6

Percentuale di regioni sovrapposte di due distribuzioni normali

Mi chiedevo, date due distribuzioni normali con eσ1, μ 1σ1, μ1\sigma_1,\ \mu_1σ2, μ 2σ2, μ2\sigma_2, \ \mu_2 come posso calcolare la percentuale di regioni sovrapposte di due distribuzioni? Suppongo che questo problema abbia un nome specifico, sei a conoscenza di qualche nome particolare che descriva questo problema? Sei a conoscenza …

46 normal-distribution similarities metric bhattacharyya

2

Clustering gerarchico con dati di tipo misto: quale distanza / somiglianza usare?

Nel mio set di dati abbiamo variabili sia continue che naturalmente discrete. Voglio sapere se possiamo fare un cluster gerarchico usando entrambi i tipi di variabili. E se sì, quale misura di distanza è appropriata?

34 clustering similarities distance-functions mixed-type-data

1

Confronto di dendrogrammi di clustering gerarchici ottenuti con distanze e metodi diversi

[Il titolo iniziale "Misurazione della somiglianza per gli alberi del cluster gerarchico" è stato successivamente modificato da @ttnphns per riflettere meglio l'argomento] Sto eseguendo una serie di analisi di gruppi gerarchici su un frame di dati dei record dei pazienti (ad esempio simile a http://www.biomedcentral.com/1471-2105/5/126/figure/F1?highres=y ) Sto sperimentando misure di …

28 r clustering distance-functions similarities dendrogram

1

Conversione della matrice di somiglianza in matrice di distanza (euclidea)

Nell'algoritmo della foresta casuale, Breiman (autore) costruisce una matrice di somiglianza come segue: Invia tutti gli esempi di apprendimento giù per ogni albero nella foresta Se due esempi arrivano alla stessa foglia incrementano l'elemento corrispondente nella matrice di somiglianza di 1 Normalizza la matrice con il numero di alberi Lui …

27 random-forest distance similarities euclidean

2

Coefficienti di somiglianza per i dati binari: perché scegliere Jaccard su Russell e Rao?

Da Encyclopedia of Statistical Sciences ho capito che dati gli attributi (dicotomici (binari: 1 = presenti; 0 = assenti) (variabili), possiamo formare una tabella di contingenza per due oggetti i e j di un campione:ppp j 1 0 ------- 1 | a | b | i ------- 0 | c …

20 binary-data similarities association-measure

5

Esiste una funzione R che calcolerà la matrice di dissomiglianza del coseno? [chiuso]

Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso l'anno scorso . Vorrei creare una mappa di calore con raggruppamento di righe basato sulle distanze del coseno. Sto usando R …

20 r clustering similarities

5

Misure di somiglianza tra le curve?

Vorrei calcolare la misura della somiglianza tra due insiemi di punti ordinati --- quelli sotto Utente rispetto a quelli sotto Insegnante : I punti sono curve nello spazio 3D, ma stavo pensando che il problema sarebbe stato semplificato se li avessi tracciati in 2 dimensioni come nell'immagine. Se i punti …

17 multiple-comparisons similarities curves procrustes-analysis

3

Punteggio e somiglianza euclidea della distanza

Sto solo lavorando con il libro Collective Intelligence (di Toby Segaran) e mi sono imbattuto nel punteggio di distanza euclideo. Nel libro l'autore mostra come calcolare la somiglianza tra due array di raccomandazioni (cioè .persona × film ↦ punteggio )person×movie↦score)\textrm{person} \times \textrm{movie} \mapsto \textrm{score}) Calcola la distanza euclidea di due …

13 distance-functions similarities

3

Quantificazione della somiglianza tra due set di dati

Riepilogo : cercare di trovare il metodo migliore per riepilogare la somiglianza tra due insiemi di dati allineati utilizzando un singolo valore. Dettagli : La mia domanda è meglio spiegata con un diagramma. I grafici seguenti mostrano due diversi set di dati, ciascuno con valori etichettati nfe nr. I punti …

12 similarities

4

Qual è lo scopo della normalizzazione delle righe

Comprendo il ragionamento alla base della normalizzazione delle colonne, in quanto fa sì che le caratteristiche siano ponderate allo stesso modo, anche se non sono misurate sulla stessa scala - tuttavia, spesso nella letteratura del vicino più vicino, sia le colonne che le righe sono normalizzate. Qual è la normalizzazione …

12 normalization distance similarities k-nearest-neighbour

1

Qual è la funzione di distanza ottimale per gli individui quando gli attributi sono nominali?

Non so quale funzione di distanza tra individui utilizzare in caso di attributi nominali (non ordinati categorici). Stavo leggendo alcuni libri di testo e suggeriscono la funzione Abbinamento semplice , ma alcuni libri suggeriscono che dovrei cambiare gli attributi nominali in binari e usare Jaccard Coefficient. Tuttavia, cosa succede se …

12 distance-functions distance similarities association-measure categorical-data

2

Il teorema di Mercer funziona al contrario?

Un collega ha una funzione e per i nostri scopi è un black-box. La funzione misura la somiglianza di due oggetti.ssss(a,b)s(a,b)s(a,b) Sappiamo per certo che ha queste proprietà:sss I punteggi di somiglianza sono numeri reali compresi tra 0 e 1, inclusi. Solo gli oggetti identici a se stessi hanno punteggi …

11 kernel-trick distance similarities rbf-kernel

2

Tecnica di apprendimento automatico per l'apprendimento di stringhe

Ho un elenco di parole, appartenenti a diverse categorie autodefinite. Ogni categoria ha il suo modello (ad esempio uno ha una lunghezza fissa con caratteri speciali, un'altra esiste di caratteri che si verificano solo in questa categoria di "parola", ...). Per esempio: "ABC" -> type1 "ACC" -> type1 "a8 219" …

11 machine-learning classification similarities supervised-learning

1

Come posso incorporare un valore anomalo innovativo all'osservazione 48 nel mio modello ARIMA?

Sto lavorando su un set di dati. Dopo aver usato alcune tecniche di identificazione del modello, sono uscito con un modello ARIMA (0,2,1). Ho usato la detectIOfunzione nel pacchetto TSAin R per rilevare un valore anomalo innovativo (IO) alla 48a osservazione del mio set di dati originale. Come posso incorporare …

10 r time-series arima outliers hypergeometric fishers-exact r time-series intraclass-correlation r logistic glmm clogit mixed-model spss repeated-measures ancova machine-learning python scikit-learn distributions data-transformation stochastic-processes web standard-deviation r machine-learning spatial similarities spatio-temporal binomial sparse poisson-process r regression nonparametric r regression logistic simulation power-analysis r svm random-forest anova repeated-measures manova regression statistical-significance cross-validation group-differences model-comparison r spatial model-evaluation parallel-computing generalized-least-squares r stata fitting mixture hypothesis-testing categorical-data hypothesis-testing anova statistical-significance repeated-measures likert wilcoxon-mann-whitney boxplot statistical-significance confidence-interval forecasting prediction-interval regression categorical-data stata least-squares experiment-design skewness reliability cronbachs-alpha r regression splines maximum-likelihood modeling likelihood-ratio profile-likelihood nested-models

3

Come trovare somiglianze tra le serie storiche?

Nel seguente esempio ho una cornice di dati che consiste in una serie temporale di misurazioni della temperatura dell'acqua registrate a 5 profondità nell'oceano in cui ciascun valore in Tempcorrisponde alla data in DateTimee alla profondità in Depth. set.seed(1) Temp <- rnorm(43800,sd=20) AirT <- rnorm(8760,sd=20) Depth <- c(1:5) DateTime = …

10 r time-series correlation similarities

Domande taggate «similarities»