Statistiche e Big Data

3

È questa la soluzione al problema del valore p?

Nel febbraio 2016, l'American Statistical Association ha rilasciato una dichiarazione formale sul significato statistico e sui valori p. Il nostro thread al riguardo discute ampiamente di questi problemi. Tuttavia, nessuna autorità è emersa per offrire un'alternativa efficace universalmente riconosciuta - fino ad ora. L'American Statistical Society (ASS) ha pubblicato la …

67 hypothesis-testing statistical-significance p-value

2

Qual è la relazione tra analisi dei componenti indipendenti e analisi dei fattori?

Sono nuovo di Independent Component Analysis (ICA) e ho solo una comprensione rudimentale del metodo. Mi sembra che l'ICA sia simile all'analisi fattoriale (FA) con una sola eccezione: l'ICA presume che le variabili casuali osservate siano una combinazione lineare di componenti / fattori indipendenti non gaussiani, mentre il modello FA …

67 multivariate-analysis factor-analysis ica

10

C'è qualche base * matematica * per il dibattito bayesiano vs frequentista?

Su Wikipedia dice che: la matematica [della probabilità] è ampiamente indipendente da qualsiasi interpretazione della probabilità. Domanda: Quindi se vogliamo essere matematicamente corretti, non dovremmo impedire qualsiasi interpretazione della probabilità? Vale a dire, sia il bayesiano che il frequentismo sono matematicamente errati? Non mi piace la filosofia, ma mi piace …

67 probability bayesian frequentist philosophical kolmogorov-axioms

3

Modo corretto di utilizzare la rete neurale ricorrente per l'analisi delle serie storiche

Le reti neurali ricorrenti differiscono da quelle "normali" per il fatto che hanno un livello di "memoria". A causa di questo livello, le NN ricorrenti dovrebbero essere utili nella modellazione di serie temporali. Tuttavia, non sono sicuro di aver capito correttamente come usarli. Diciamo che ho le seguenti serie temporali …

67 time-series machine-learning neural-networks

6

Convergenza in probabilità vs. convergenza quasi sicura

Non ho mai veramente criticato la differenza tra queste due misure di convergenza. (O, in effetti, uno qualsiasi dei diversi tipi di convergenza, ma menziono questi due in particolare a causa delle leggi deboli e forti dei grandi numeri.) Certo, posso citare la definizione di ciascuno e dare un esempio …

67 probability random-variable

8

Quali sono le buone statistiche di base da usare per i dati ordinali?

Ho ottenuto alcuni dati ordinali dalle domande del sondaggio. Nel mio caso sono risposte in stile Likert (Fortemente in disaccordo, in disaccordo, neutrale, d'accordo, fortemente d'accordo). Nei miei dati sono codificati come 1-5. Non credo che significherebbe molto qui, quindi quali statistiche di riepilogo di base sono considerate utili?

67 descriptive-statistics likert ordinal-data

1

Quando utilizzare un offset in una regressione di Poisson?

Qualcuno sa perché viene utilizzato l'offset in una regressione di Poisson? Cosa ottieni da questo?

67 poisson-regression offset

5

In che modo esattamente gli statistici hanno accettato di usare (n-1) come lo stimatore imparziale per la varianza della popolazione senza simulazione?

La formula per la varianza informatica ha nel denominatore:(n−1)(n−1)(n-1) s2=∑Ni=1(xi−x¯)2n−1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} Mi sono sempre chiesto perché. Tuttavia, leggere e guardare alcuni buoni video sul "perché" è, a quanto pare, è un buon stimatore imparziale della varianza della popolazione. Considerando che sottovaluta e sopravvaluta la varianza della …

67 variance unbiased-estimator proof history

5

Carichi vs autovettori in PCA: quando utilizzare l'uno o l'altro?

Nell'analisi dei componenti principali (PCA), otteniamo autovettori (vettori di unità) ed autovalori. Ora, definiamo i caricamenti come Carichi = autovettori ⋅ autovalori----------√.carichi=autovettori⋅autovalori.\text{Loadings} = \text{Eigenvectors} \cdot \sqrt{\text{Eigenvalues}}. So che gli autovettori sono solo direzioni e i caricamenti (come definiti sopra) includono anche la varianza lungo queste direzioni. Ma per una mia …

67 pca

4

Cosa rende il kernel gaussiano così magico per PCA e anche in generale?

Stavo leggendo del kernel PCA ( 1 , 2 , 3 ) con kernel gaussiani e polinomiali. In che modo il kernel gaussiano separa apparentemente eccezionalmente bene qualsiasi tipo di dati non lineari? Si prega di fornire un'analisi intuitiva, oltre a una matematicamente coinvolta, se possibile. Qual è una proprietà …

67 machine-learning pca svm kernel-trick

1

Quale correlazione rende singolare una matrice e quali sono le implicazioni della singolarità o della quasi-singolarità?

Sto facendo alcuni calcoli su matrici diverse (principalmente nella regressione logistica) e comunemente ottengo l'errore "Matrix is singular", dove devo tornare indietro e rimuovere le variabili correlate. La mia domanda qui è cosa considereresti una matrice "altamente" correlata? Esiste un valore soglia di correlazione per rappresentare questa parola? Come se …

66 regression correlation matrix multicollinearity singular

9

Questo grafico mostra statisticamente utile la probabilità di un attacco terroristico?

Vedo che questa immagine è passata molto in giro. Ho la sensazione che le informazioni fornite in questo modo siano in qualche modo incomplete o addirittura errate, ma non sono abbastanza esperto nelle statistiche per rispondere. Mi viene in mente questo fumetto di xkcd , che anche con solidi dati …

66 probability interpretation prediction

4

Guarda e troverai (una correlazione)

Ho diverse centinaia di misurazioni. Ora sto pensando di utilizzare un qualche tipo di software per correlare ogni misura con ogni misura. Ciò significa che ci sono migliaia di correlazioni. Tra questi ci dovrebbe essere (statisticamente) un'alta correlazione, anche se i dati sono completamente casuali (ogni misura ha solo circa …

66 correlation multiple-comparisons permutation-test

7

Quanto da pagare? Un problema pratico

Questa non è una domanda di lavoro a domicilio ma un vero problema affrontato dalla nostra azienda. Molto recentemente (2 giorni fa) abbiamo ordinato a un rivenditore la produzione di 10000 etichette di prodotti. Il rivenditore è persona indipendente. Riceve le etichette prodotte dall'esterno e l'azienda effettua il pagamento al …

66 probability bayesian model decision-theory

7

Perché ottimizzare la probabilità massima di registro anziché la probabilità

Nella maggior parte delle attività di apprendimento automatico in cui è possibile formulare alcune probabilità ppp che dovrebbero essere massimizzate, si dovrebbe effettivamente ottimizzare il registro probabilità logplog⁡p\log p invece della probabilità per alcuni parametri θθ\theta . Ad esempio, nella formazione di massima verosimiglianza, di solito è la verosimiglianza. Quando …

66 probability optimization log-likelihood