Mi chiedevo, date due distribuzioni normali con eσ1, μ 1σ1, μ1\sigma_1,\ \mu_1σ2, μ 2σ2, μ2\sigma_2, \ \mu_2 come posso calcolare la percentuale di regioni sovrapposte di due distribuzioni? Suppongo che questo problema abbia un nome specifico, sei a conoscenza di qualche nome particolare che descriva questo problema? Sei a conoscenza …
Nel mio set di dati abbiamo variabili sia continue che naturalmente discrete. Voglio sapere se possiamo fare un cluster gerarchico usando entrambi i tipi di variabili. E se sì, quale misura di distanza è appropriata?
[Il titolo iniziale "Misurazione della somiglianza per gli alberi del cluster gerarchico" è stato successivamente modificato da @ttnphns per riflettere meglio l'argomento] Sto eseguendo una serie di analisi di gruppi gerarchici su un frame di dati dei record dei pazienti (ad esempio simile a http://www.biomedcentral.com/1471-2105/5/126/figure/F1?highres=y ) Sto sperimentando misure di …
Nell'algoritmo della foresta casuale, Breiman (autore) costruisce una matrice di somiglianza come segue: Invia tutti gli esempi di apprendimento giù per ogni albero nella foresta Se due esempi arrivano alla stessa foglia incrementano l'elemento corrispondente nella matrice di somiglianza di 1 Normalizza la matrice con il numero di alberi Lui …
Da Encyclopedia of Statistical Sciences ho capito che dati gli attributi (dicotomici (binari: 1 = presenti; 0 = assenti) (variabili), possiamo formare una tabella di contingenza per due oggetti i e j di un campione:ppp j 1 0 ------- 1 | a | b | i ------- 0 | c …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso l'anno scorso . Vorrei creare una mappa di calore con raggruppamento di righe basato sulle distanze del coseno. Sto usando R …
Vorrei calcolare la misura della somiglianza tra due insiemi di punti ordinati --- quelli sotto Utente rispetto a quelli sotto Insegnante : I punti sono curve nello spazio 3D, ma stavo pensando che il problema sarebbe stato semplificato se li avessi tracciati in 2 dimensioni come nell'immagine. Se i punti …
Sto solo lavorando con il libro Collective Intelligence (di Toby Segaran) e mi sono imbattuto nel punteggio di distanza euclideo. Nel libro l'autore mostra come calcolare la somiglianza tra due array di raccomandazioni (cioè .persona × film ↦ punteggio )person×movie↦score)\textrm{person} \times \textrm{movie} \mapsto \textrm{score}) Calcola la distanza euclidea di due …
Riepilogo : cercare di trovare il metodo migliore per riepilogare la somiglianza tra due insiemi di dati allineati utilizzando un singolo valore. Dettagli : La mia domanda è meglio spiegata con un diagramma. I grafici seguenti mostrano due diversi set di dati, ciascuno con valori etichettati nfe nr. I punti …
Comprendo il ragionamento alla base della normalizzazione delle colonne, in quanto fa sì che le caratteristiche siano ponderate allo stesso modo, anche se non sono misurate sulla stessa scala - tuttavia, spesso nella letteratura del vicino più vicino, sia le colonne che le righe sono normalizzate. Qual è la normalizzazione …
Non so quale funzione di distanza tra individui utilizzare in caso di attributi nominali (non ordinati categorici). Stavo leggendo alcuni libri di testo e suggeriscono la funzione Abbinamento semplice , ma alcuni libri suggeriscono che dovrei cambiare gli attributi nominali in binari e usare Jaccard Coefficient. Tuttavia, cosa succede se …
Un collega ha una funzione e per i nostri scopi è un black-box. La funzione misura la somiglianza di due oggetti.ssss(a,b)s(a,b)s(a,b) Sappiamo per certo che ha queste proprietà:sss I punteggi di somiglianza sono numeri reali compresi tra 0 e 1, inclusi. Solo gli oggetti identici a se stessi hanno punteggi …
Ho un elenco di parole, appartenenti a diverse categorie autodefinite. Ogni categoria ha il suo modello (ad esempio uno ha una lunghezza fissa con caratteri speciali, un'altra esiste di caratteri che si verificano solo in questa categoria di "parola", ...). Per esempio: "ABC" -> type1 "ACC" -> type1 "a8 219" …
Sto lavorando su un set di dati. Dopo aver usato alcune tecniche di identificazione del modello, sono uscito con un modello ARIMA (0,2,1). Ho usato la detectIOfunzione nel pacchetto TSAin R per rilevare un valore anomalo innovativo (IO) alla 48a osservazione del mio set di dati originale. Come posso incorporare …
Nel seguente esempio ho una cornice di dati che consiste in una serie temporale di misurazioni della temperatura dell'acqua registrate a 5 profondità nell'oceano in cui ciascun valore in Tempcorrisponde alla data in DateTimee alla profondità in Depth. set.seed(1) Temp <- rnorm(43800,sd=20) AirT <- rnorm(8760,sd=20) Depth <- c(1:5) DateTime = …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.