Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

1
Perché i miei valori p differiscono tra l'output di regressione logistica, il test chi-quadrato e l'intervallo di confidenza per l'OR?
Ho costruito una regressione logistica in cui la variabile di risultato viene curata dopo aver ricevuto il trattamento ( Curevs. No Cure). Tutti i pazienti in questo studio hanno ricevuto un trattamento. Sono interessato a vedere se il diabete è associato a questo risultato. In R il mio output di …

2
Quando t-SNE è fuorviante?
Citando uno degli autori: t-Distributed Stochastic Neighbor Embedding (t-SNE) è una tecnica ( premiata ) per la riduzione della dimensionalità che è particolarmente adatta per la visualizzazione di set di dati ad alta dimensione. Quindi suona abbastanza bene, ma è l'autore a parlare. Un'altra citazione dell'autore (in riferimento al suddetto …

3
Il segno dei punteggi o dei caricamenti in PCA o FA ha un significato? Posso invertire il segno?
Ho eseguito l'analisi dei componenti principali (PCA) con R usando due diverse funzioni ( prcompe princomp) e ho osservato che i punteggi PCA differivano nel segno. Come può essere? Considera questo: set.seed(999) prcomp(data.frame(1:10,rnorm(10)))$x PC1 PC2 [1,] -4.508620 -0.2567655 [2,] -3.373772 -1.1369417 [3,] -2.679669 1.0903445 [4,] -1.615837 0.7108631 [5,] -0.548879 0.3093389 …
37 r  pca  factor-analysis 

4
Differenza tra previsione e previsione?
Mi chiedevo che differenza e relazione ci sono tra previsione e previsione? Soprattutto nelle serie storiche e nella regressione? Ad esempio, ho ragione che: Nelle serie storiche, la previsione sembra significare stimare i valori futuri dati i valori passati di una serie storica. In regressione, la previsione sembra significare stimare …



5
Analisi di serie temporali di convalida incrociata
Ho usato il pacchetto caret in R per costruire modelli predittivi per la classificazione e la regressione. Caret fornisce un'interfaccia unificata per mettere a punto gli iperparametri del modello mediante validazione incrociata o avvio del boot. Ad esempio, se stai costruendo un semplice modello di "vicini più vicini" per la …

2
Se solo la previsione è interessante, perché usare il lazo sulla cresta?
A pagina 223 in Un'introduzione all'apprendimento statistico , gli autori sintetizzano le differenze tra regressione della cresta e lazo. Forniscono un esempio (Figura 6.9) di quando "il lazo tende a sovraperformare la regressione della cresta in termini di distorsione, varianza e MSE". Capisco perché il lazo può essere desiderabile: si …


8
Qual è la differenza tra previsione e inferenza?
Sto leggendo " Un'introduzione all'apprendimento statistico ". Nel capitolo 2, discutono il motivo della stima di una funzione .fff 2.1.1 Perché stimare ?fff Ci sono due motivi principali per cui potremmo voler stimare f : previsione e inferenza . Ne discutiamo a turno. L'ho letto più volte, ma in parte …


1
Perché il test di Mantel è preferito a me di Moran?
Il test di Mantel è ampiamente utilizzato negli studi biologici per esaminare la correlazione tra la distribuzione spaziale degli animali (posizione nello spazio) con, ad esempio, la loro relazione genetica, il tasso di aggressività o qualche altro attributo. Molte buone riviste lo stanno utilizzando ( PNAS, comportamento animale, ecologia molecolare …


1
Inferenza variabile rispetto a MCMC: quando scegliere l'una rispetto all'altra?
Penso di avere l'idea generale di VI e MCMC, compresi i vari gusti di MCMC come il campionamento di Gibbs, Metropolis Hastings ecc. Questo documento fornisce una meravigliosa esposizione di entrambi i metodi. Ho le seguenti domande: Se desidero fare l'inferenza bayesiana, perché dovrei scegliere un metodo rispetto all'altro? Quali …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.