Statistiche e Big Data

1

Perché i miei valori p differiscono tra l'output di regressione logistica, il test chi-quadrato e l'intervallo di confidenza per l'OR?

Ho costruito una regressione logistica in cui la variabile di risultato viene curata dopo aver ricevuto il trattamento ( Curevs. No Cure). Tutti i pazienti in questo studio hanno ricevuto un trattamento. Sono interessato a vedere se il diabete è associato a questo risultato. In R il mio output di …

37 r hypothesis-testing logistic generalized-linear-model odds-ratio

2

Quando t-SNE è fuorviante?

Citando uno degli autori: t-Distributed Stochastic Neighbor Embedding (t-SNE) è una tecnica ( premiata ) per la riduzione della dimensionalità che è particolarmente adatta per la visualizzazione di set di dati ad alta dimensione. Quindi suona abbastanza bene, ma è l'autore a parlare. Un'altra citazione dell'autore (in riferimento al suddetto …

37 data-visualization dimensionality-reduction tsne

3

Il segno dei punteggi o dei caricamenti in PCA o FA ha un significato? Posso invertire il segno?

Ho eseguito l'analisi dei componenti principali (PCA) con R usando due diverse funzioni ( prcompe princomp) e ho osservato che i punteggi PCA differivano nel segno. Come può essere? Considera questo: set.seed(999) prcomp(data.frame(1:10,rnorm(10)))$x PC1 PC2 [1,] -4.508620 -0.2567655 [2,] -3.373772 -1.1369417 [3,] -2.679669 1.0903445 [4,] -1.615837 0.7108631 [5,] -0.548879 0.3093389 …

37 r pca factor-analysis

4

Differenza tra previsione e previsione?

Mi chiedevo che differenza e relazione ci sono tra previsione e previsione? Soprattutto nelle serie storiche e nella regressione? Ad esempio, ho ragione che: Nelle serie storiche, la previsione sembra significare stimare i valori futuri dati i valori passati di una serie storica. In regressione, la previsione sembra significare stimare …

37 regression time-series forecasting terminology

3

Test di ipotesi Bootstrap vs. permutazione

Esistono diverse tecniche di ricampionamento popolari, che vengono spesso utilizzate nella pratica, come bootstrap, test di permutazione, coltello a serramanico, ecc. Ci sono numerosi articoli e libri che discutono di queste tecniche, ad esempio Philip I Good (2010) Test di permutazione, parametri e Bootstrap di ipotesi La mia domanda è: …

37 hypothesis-testing nonparametric bootstrap permutation-test

2

Comprensione dei parametri all'interno della distribuzione binomiale negativa

Stavo cercando di adattare i miei dati a vari modelli e ho capito che la fitdistrfunzione della libreria MASSdi Rmi dà Negative Binomialla soluzione migliore. Ora dalla pagina wiki , la definizione è data come: La distribuzione NegBin (r, p) descrive la probabilità di k fallimenti e r successi nelle …

37 r distributions modeling negative-binomial

5

Analisi di serie temporali di convalida incrociata

Ho usato il pacchetto caret in R per costruire modelli predittivi per la classificazione e la regressione. Caret fornisce un'interfaccia unificata per mettere a punto gli iperparametri del modello mediante validazione incrociata o avvio del boot. Ad esempio, se stai costruendo un semplice modello di "vicini più vicini" per la …

37 r time-series cross-validation

2

Se solo la previsione è interessante, perché usare il lazo sulla cresta?

A pagina 223 in Un'introduzione all'apprendimento statistico , gli autori sintetizzano le differenze tra regressione della cresta e lazo. Forniscono un esempio (Figura 6.9) di quando "il lazo tende a sovraperformare la regressione della cresta in termini di distorsione, varianza e MSE". Capisco perché il lazo può essere desiderabile: si …

37 machine-learning prediction lasso regularization ridge-regression

4

Cosa devo fare quando la mia rete neurale non si generalizza bene?

Sto allenando una rete neurale e la perdita di allenamento diminuisce, ma la perdita di validazione non lo fa, o diminuisce molto meno di quanto mi aspetterei, sulla base di riferimenti o esperimenti con architetture e dati molto simili. Come posso risolvere questo problema? Per quanto riguarda la domanda Cosa …

37 neural-networks deep-learning

8

Qual è la differenza tra previsione e inferenza?

Sto leggendo " Un'introduzione all'apprendimento statistico ". Nel capitolo 2, discutono il motivo della stima di una funzione .fff 2.1.1 Perché stimare ?fff Ci sono due motivi principali per cui potremmo voler stimare f : previsione e inferenza . Ne discutiamo a turno. L'ho letto più volte, ma in parte …

37 prediction terminology causality

4

Differenza tra "kernel" e "filtro" nella CNN

Qual è la differenza tra i termini "kernel" e "filtro" nel contesto delle reti neurali convoluzionali?

37 neural-networks terminology deep-learning conv-neural-network

1

Perché il test di Mantel è preferito a me di Moran?

Il test di Mantel è ampiamente utilizzato negli studi biologici per esaminare la correlazione tra la distribuzione spaziale degli animali (posizione nello spazio) con, ad esempio, la loro relazione genetica, il tasso di aggressività o qualche altro attributo. Molte buone riviste lo stanno utilizzando ( PNAS, comportamento animale, ecologia molecolare …

37 r correlation spatial pattern-recognition

1

Quali sono le misure facili da interpretare, la bontà di adattamento per i modelli lineari ad effetti misti?

Attualmente sto usando il pacchetto R lme4 . Sto usando un modello lineare di effetti misti con effetti casuali: library(lme4) mod1 <- lmer(r1 ~ (1 | site), data = sample_set) #Only random effects mod2 <- lmer(r1 ~ p1 + (1 | site), data = sample_set) #One fixed effect + # …

37 r regression mixed-model random-effects-model

1

Inferenza variabile rispetto a MCMC: quando scegliere l'una rispetto all'altra?

Penso di avere l'idea generale di VI e MCMC, compresi i vari gusti di MCMC come il campionamento di Gibbs, Metropolis Hastings ecc. Questo documento fornisce una meravigliosa esposizione di entrambi i metodi. Ho le seguenti domande: Se desidero fare l'inferenza bayesiana, perché dovrei scegliere un metodo rispetto all'altro? Quali …

37 machine-learning bayesian mcmc variational-bayes approximate-inference

5

Come gestire un modello di previsione "autolesionista"?

Stavo guardando una presentazione di uno specialista ML di un importante rivenditore, in cui avevano sviluppato un modello per prevedere eventi fuori stock. Supponiamo per un momento che nel tempo il loro modello diventi molto preciso, non sarebbe in qualche modo "autolesionista"? Cioè, se il modello funziona davvero bene, allora …

36 machine-learning predictive-models