Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

1
Le prestazioni allo stato dell'arte riportate nell'uso dei vettori di paragrafo per l'analisi del sentiment sono state replicate?
Sono rimasto impressionato dai risultati del documento ICML 2014 " Rappresentazioni distribuite di frasi e documenti " di Le e Mikolov. La tecnica che descrivono, chiamata "vettori di paragrafo", apprende rappresentazioni senza supervisione di paragrafi / documenti arbitrariamente lunghi, basati su un'estensione del modello word2vec. Il documento riporta prestazioni all'avanguardia …


2
Come interpretare questi grafici acf e pacf
Di seguito sono riportati i grafici acf e pacf di una serie di dati mensile. La seconda trama è acf con ci.type = 'ma': La persistenza di valori elevati nel diagramma acf rappresenta probabilmente una tendenza positiva a lungo termine. La domanda è se questo rappresenta una variazione stagionale? Ho …

1
Perché i valori stimati di un migliore predittore lineare non polarizzato (BLUP) differiscono da un miglior stimatore lineare parziale (BLU)?
Comprendo che la differenza tra loro è correlata al fatto che la variabile di raggruppamento nel modello sia stimata come un effetto fisso o casuale, ma non mi è chiaro perché non siano gli stessi (se non sono uguali). Sono particolarmente interessato a come funziona quando si utilizza la stima …


2
C'è qualche vantaggio di SVD su PCA?
So calcolare matematicamente PCA e SVD e so che entrambi possono essere applicati alla regressione dei minimi quadrati lineari. Il vantaggio principale di SVD matematicamente sembra essere che può essere applicato a matrici non quadrate. Entrambi si concentrano sulla decomposizione della matriceA parte il vantaggio di SVD menzionato, ci sono …
20 pca  least-squares  svd 


6
La mediana è un tipo di media, per una certa generalizzazione di "media"?
Il concetto di "media" è molto più ampio della media aritmetica tradizionale; si estende fino a includere la mediana? Per analogia, raw data⟶idraw data⟶meanraw mean⟶id−1arithmetic meanraw data⟶recipreciprocals⟶meanmean reciprocal⟶recip−1harmonic meanraw data⟶loglogs⟶meanmean log⟶log−1geometric meanraw data⟶squaresquares⟶meanmean square⟶square−1root mean squareraw data⟶rankranks⟶meanmean rank⟶rank−1medianraw data⟶idraw data⟶meanraw mean⟶id−1arithmetic meanraw data⟶recipreciprocals⟶meanmean reciprocal⟶recip−1harmonic meanraw data⟶loglogs⟶meanmean log⟶log−1geometric meanraw data⟶squaresquares⟶meanmean square⟶square−1root …
20 mean  average  median 








Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.