Costruire rappresentazioni grafiche significative e utili dei dati. (Se la tua domanda riguarda solo come ottenere un determinato software per produrre un effetto specifico, probabilmente non è qui sull'argomento.)
Sono sicuro di essermi imbattuto in una funzione come questa in un pacchetto R in precedenza, ma dopo un esteso googling non riesco a trovarla da nessuna parte. La funzione a cui sto pensando ha prodotto un riepilogo grafico per una variabile assegnatagli, producendo un output con alcuni grafici (un …
Per la stampa con R, dovrei imparare ggplot2 o ggvis? Non voglio necessariamente imparare entrambi se uno di loro è superiore sotto tutti gli aspetti. Perché la comunità R continua a creare nuovi pacchetti con funzionalità sovrapposte? Il post sul blog di introduzione non menziona una parola per cui ggvis …
Voglio ridurre la dimensionalità dei sistemi di ordine superiore e catturare la maggior parte della covarianza su un campo preferibilmente bidimensionale o monodimensionale. Capisco che ciò può essere fatto tramite l'analisi dei componenti principali e ho usato PCA in molti scenari. Tuttavia, non l'ho mai usato con tipi di dati …
Le reti neurali sono spesso trattate come "scatole nere" a causa della loro struttura complessa. Questo non è l'ideale, in quanto è spesso utile avere una comprensione intuitiva del funzionamento interno di un modello. Quali sono i metodi per visualizzare il funzionamento di una rete neurale addestrata? In alternativa, come …
Citando uno degli autori: t-Distributed Stochastic Neighbor Embedding (t-SNE) è una tecnica ( premiata ) per la riduzione della dimensionalità che è particolarmente adatta per la visualizzazione di set di dati ad alta dimensione. Quindi suona abbastanza bene, ma è l'autore a parlare. Un'altra citazione dell'autore (in riferimento al suddetto …
D: Esistono prove sperimentali a supporto di visualizzazioni in stile Tufte, minimaliste e basate su dati, oltre alle visualizzazioni cariche di grafici, per esempio Nigel Holmes ? Ho chiesto come aggiungere junk grafico ai grafici R qui e i rispondenti mi hanno lanciato una grande quantità di snark. Quindi, sicuramente, …
Sto cercando di usare la trama silhouette per determinare il numero di cluster nel mio set di dati. Dato il set di dati Train , ho usato il seguente codice matlab Train_data = full(Train); Result = []; for num_of_cluster = 1:20 centroid = kmeans(Train_data,num_of_cluster,'distance','sqeuclid'); s = silhouette(Train_data,centroid,'sqeuclid'); Result = [ …
Carissimi, ho notato qualcosa di strano che non posso spiegare, vero? In sintesi: l'approccio manuale al calcolo di un intervallo di confidenza in un modello di regressione logistica e la funzione R confint()danno risultati diversi. Ho attraversato la regressione logistica applicata di Hosmer & Lemeshow (2a edizione). Nel terzo capitolo …
Mi piacerebbe sapere se esiste una variante boxplot adattata ai dati distribuiti di Poisson (o forse ad altre distribuzioni)? Con una distribuzione gaussiana, i baffi posizionati su L = Q1 - 1,5 IQR e U = Q3 + 1,5 IQR, il boxplot ha la proprietà che ci saranno all'incirca tanti …
Mi sono appena imbattuto nel quartetto di Anscombe (quattro set di dati che hanno statistiche descrittive quasi indistinguibili ma sembrano molto diversi quando vengono tracciati) e sono curioso di sapere se ci sono altri set di dati più o meno noti che sono stati creati per dimostrare l'importanza di alcuni …
Proporrò questa domanda per mezzo di un esempio. Supponiamo di avere un set di dati, come il set di dati sui prezzi delle case di Boston, in cui ho variabili continue e categoriche. Qui abbiamo una variabile di "qualità", da 1 a 10, e il prezzo di vendita. Posso separare …
Molto è stato scritto in merito alle scelte cromatiche compatibili con i non vedenti per mappe, poligoni e regioni ombreggiate in generale (vedere ad esempio http://colorbrewer2.org ). Non sono stato in grado di trovare consigli per i colori delle linee e lo spessore delle linee variabili per i grafici a …
Voglio generare la trama descritta nel libro ElemStatLearn "Gli elementi dell'apprendimento statistico: data mining, inferenza e previsione. Seconda edizione" di Trevor Hastie, Robert Tibshirani e Jerome Friedman. La trama è: Mi chiedo come posso produrre questo grafico esatto R, in particolare notare la griglia grafica e il calcolo per mostrare …
È possibile visualizzare l'output dell'analisi dei componenti principali in modo da fornire maggiori informazioni oltre alle semplici tabelle di riepilogo? È possibile farlo quando il numero di osservazioni è grande, diciamo ~ 1e4? Ed è possibile farlo in R [benvenuto in altri ambienti]?
Oltre a gnuplot e ggobi , quali strumenti open source vengono utilizzati dalle persone per visualizzare dati multidimensionali? Gnuplot è più o meno un pacchetto base per la stampa. Ggobi può fare una serie di cose ingegnose, come: animare i dati lungo una dimensione o tra raccolte discrete animare combinazioni …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.