Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Uso lme4 in R per adattarmi al modello misto lmer(value~status+(1|experiment))) dove il valore è continuo, lo stato e l'esperimento sono fattori e ottengo Linear mixed model fit by REML Formula: value ~ status + (1 | experiment) AIC BIC logLik deviance REMLdev 29.1 46.98 -9.548 5.911 19.1 Random effects: Groups …
Voglio rilevare la stagionalità nei dati che ricevo. Ci sono alcuni metodi che ho trovato come il diagramma delle sottoserie stagionali e il diagramma di autocorrelazione ma il fatto è che non capisco come leggere il grafico, qualcuno potrebbe aiutarmi? L'altra cosa è, ci sono altri metodi per rilevare la …
Qualcuno ha qualche esperienza con il software (preferibilmente gratuito, preferibilmente open source) che acquisirà un'immagine dei dati tracciati su coordinate cartesiane (una trama standard quotidiana) ed estrarrà le coordinate dei punti tracciati sul grafico? In sostanza, si tratta di un problema di data mining e di visualizzazione inversa dei dati.
Ricordo ancora il documento Annals of Statistics su Boosting di Friedman-Hastie-Tibshirani e i commenti sugli stessi argomenti di altri autori (inclusi Freund e Schapire). A quel tempo, chiaramente Boosting era considerato una svolta sotto molti aspetti: computazionalmente fattibile, un metodo d'insieme, con prestazioni eccellenti ma misteriose. Nello stesso periodo, SVM …
Perché continuare a insegnare e utilizzare il test delle ipotesi (con tutti i suoi concetti difficili e che sono tra i peccati più statistici) per i problemi in cui esiste uno stimatore di intervallo (confidenza, bootstrap, credibilità o altro)? Qual è la migliore spiegazione (se presente) da dare agli studenti? …
Ho i dati di un esperimento che ho analizzato usando i test t. La variabile dipendente viene ridimensionata in base all'intervallo e i dati sono non accoppiati (ovvero, 2 gruppi) o accoppiati (ovvero, all'interno dei soggetti). Ad esempio (all'interno dei soggetti): x1 <- c(99, 99.5, 65, 100, 99, 99.5, 99, …
Pensavo che il "modello a effetti casuali" in econometria corrispondesse a un "modello misto con intercettazione casuale" al di fuori dell'econometria, ma ora non ne sono sicuro. Vero? L'econometria usa termini come "effetti fissi" e "effetti casuali" in modo leggermente diverso dalla letteratura sui modelli misti, e questo provoca una …
Questa domanda è motivata dalla mia domanda sulla meta-analisi . Ma immagino che sarebbe utile anche per insegnare contesti in cui si desidera creare un set di dati che rispecchi esattamente un set di dati pubblicato esistente. So come generare dati casuali da una determinata distribuzione. Quindi, ad esempio, se …
sfondo Sto facendo ricerche cliniche in medicina e ho seguito numerosi corsi di statistica. Non ho mai pubblicato un articolo usando la regressione lineare / logistica e vorrei fare correttamente la selezione delle variabili. L'interpretazione è importante, quindi nessuna tecnica di apprendimento automatico sofisticata. Ho riassunto la mia comprensione della …
Al fine di risolvere i problemi di selezione del modello, una serie di metodi (LASSO, regressione della cresta, ecc.) Ridurrà i coefficienti delle variabili predittive verso lo zero. Sto cercando una spiegazione intuitiva del perché questo migliora l'abilità predittiva. Se il vero effetto della variabile era in realtà molto grande, …
Mi riferisco a pratiche che mantengono ancora la loro presenza, anche se i problemi (di solito computazionali) con cui sono stati progettati per far fronte sono stati per lo più risolti. Ad esempio, la correzione della continuità di Yates è stata inventata per approssimare l'esatto test di Fisher con il …
Per quanto ho capito, il test di Wald nel contesto della regressione logistica viene utilizzato per determinare se una determinata variabile predittiva è significativa o meno. Rifiuta che l'ipotesi nulla del coefficiente corrispondente sia zero.XXX Il test consiste nel dividere il valore del coefficiente per errore standard .σσ\sigma Ciò di …
Sto cercando di capire la filosofia alla base dell'utilizzo di un modello lineare generalizzato (GLM) rispetto a un modello lineare (LM). Di seguito ho creato un set di dati di esempio in cui: log(y)=x+εlog(y)=x+ε\log(y) = x + \varepsilon L'esempio non ha l'errore in funzione della grandezza di , quindi suppongo …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.