Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Sebbene questa domanda sia in qualche modo soggettiva, spero che si qualifichi come una buona domanda soggettiva secondo le linee guida sulle domande frequenti . Si basa su una domanda che Olle Häggström mi ha posto un anno fa e sebbene io abbia qualche idea a riguardo, non ho una …
Voglio generare la trama descritta nel libro ElemStatLearn "Gli elementi dell'apprendimento statistico: data mining, inferenza e previsione. Seconda edizione" di Trevor Hastie, Robert Tibshirani e Jerome Friedman. La trama è: Mi chiedo come posso produrre questo grafico esatto R, in particolare notare la griglia grafica e il calcolo per mostrare …
È noto che gli intervalli di confidenza e la verifica delle ipotesi statistiche sono fortemente correlati. Le mie domande si concentrano sul confronto delle medie per due gruppi basato su una variabile numerica. Supponiamo che tale ipotesi sia verificata usando t-test. Dall'altro lato, si possono calcolare intervalli di confidenza per …
Wikipedia spiega: Per un set di dati, la media è la somma dei valori divisa per il numero di valori. Questa definizione corrisponde tuttavia a ciò che chiamo "medio" (almeno è quello che ricordo di aver appreso). Eppure Wikipedia cita ancora una volta: Esistono altre misure statistiche che utilizzano campioni …
È possibile visualizzare l'output dell'analisi dei componenti principali in modo da fornire maggiori informazioni oltre alle semplici tabelle di riepilogo? È possibile farlo quando il numero di osservazioni è grande, diciamo ~ 1e4? Ed è possibile farlo in R [benvenuto in altri ambienti]?
Supponiamo ad esempio che stai realizzando un modello lineare, ma i dati sono complessi.yyy y= x β+ ϵy=xβ+ϵ y = x \beta + \epsilon Il mio set di dati è complesso, come in tutti i numeri in yyy sono della forma ( a + b i )(a+bi)(a + bi) . …
Nel maggio 2010 l'utente Mcorazao di Wikipedia ha aggiunto una frase all'articolo di asimmetria secondo cui "Un valore zero indica che i valori sono distribuiti in modo relativamente uniforme su entrambi i lati della media, in genere ma non necessariamente implicando una distribuzione simmetrica". Tuttavia, la pagina wiki non contiene …
Contesto: in risposta a una domanda precedente sulla ricerca riproducibile, ha scritto Jake Un problema che abbiamo scoperto durante la creazione del nostro archivio JASA è stato il cambiamento delle versioni e dei valori predefiniti dei pacchetti CRAN. Quindi, in quell'archivio, includiamo anche le versioni dei pacchetti che abbiamo usato. …
A volte nei rapporti includo un disclaimer sui valori di p e altre statistiche inferenziali che ho fornito. Dico che dal momento che il campione non era casuale, tali statistiche non si sarebbero applicate rigorosamente. La mia formulazione specifica è di solito riportata in una nota a piè di pagina: …
Ho trovato alcune distribuzioni per le quali BUGS e R hanno parametrizzazioni diverse: normale, log-normale e Weibull. Per ognuno di questi, ho capito che il secondo parametro utilizzato da R deve essere trasformato inverso (1 / parametro) prima di essere utilizzato in BUGS (o JAGS nel mio caso). Qualcuno sa …
Immaginare Si esegue una regressione lineare con quattro predittori numerici (IV1, ..., IV4) Quando è incluso solo IV1 come predittore, la beta standardizzata è +.20 Quando si include anche IV2 a IV4, il segno del coefficiente di regressione standardizzato di IV1 si ribalta -.25(ovvero diventa negativo). Ciò fa sorgere alcune …
Prendi e y ∈ { 0 , 1 } e supponiamo di modellare il compito di prevedere y dato x usando la regressione logistica. Quando è possibile scrivere i coefficienti di regressione logistica in forma chiusa?x∈{0,1}dx∈{0,1}dx \in \{0,1\}^dy∈{0,1}y∈{0,1}y \in \{0,1\} Un esempio è quando usiamo un modello saturo. Cioè, definire …
Oltre a gnuplot e ggobi , quali strumenti open source vengono utilizzati dalle persone per visualizzare dati multidimensionali? Gnuplot è più o meno un pacchetto base per la stampa. Ggobi può fare una serie di cose ingegnose, come: animare i dati lungo una dimensione o tra raccolte discrete animare combinazioni …
Sto cercando di analizzare alcuni dati usando un modello a effetti misti. I dati che ho raccolto rappresentano il peso di alcuni giovani animali di diverso genotipo nel tempo. Sto usando l'approccio proposto qui: https://gribblelab.wordpress.com/2009/03/09/repeated-measures-anova-using-r/ In particolare sto usando la soluzione n. 2 Quindi ho qualcosa del genere require(nlme) model …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.