Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

3
È questa la soluzione al problema del valore p?
Nel febbraio 2016, l'American Statistical Association ha rilasciato una dichiarazione formale sul significato statistico e sui valori p. Il nostro thread al riguardo discute ampiamente di questi problemi. Tuttavia, nessuna autorità è emersa per offrire un'alternativa efficace universalmente riconosciuta - fino ad ora. L'American Statistical Society (ASS) ha pubblicato la …


10
C'è qualche base * matematica * per il dibattito bayesiano vs frequentista?
Su Wikipedia dice che: la matematica [della probabilità] è ampiamente indipendente da qualsiasi interpretazione della probabilità. Domanda: Quindi se vogliamo essere matematicamente corretti, non dovremmo impedire qualsiasi interpretazione della probabilità? Vale a dire, sia il bayesiano che il frequentismo sono matematicamente errati? Non mi piace la filosofia, ma mi piace …





5
In che modo esattamente gli statistici hanno accettato di usare (n-1) come lo stimatore imparziale per la varianza della popolazione senza simulazione?
La formula per la varianza informatica ha nel denominatore:(n−1)(n−1)(n-1) s2=∑Ni=1(xi−x¯)2n−1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} Mi sono sempre chiesto perché. Tuttavia, leggere e guardare alcuni buoni video sul "perché" è, a quanto pare, è un buon stimatore imparziale della varianza della popolazione. Considerando che sottovaluta e sopravvaluta la varianza della …

5
Carichi vs autovettori in PCA: quando utilizzare l'uno o l'altro?
Nell'analisi dei componenti principali (PCA), otteniamo autovettori (vettori di unità) ed autovalori. Ora, definiamo i caricamenti come Carichi = autovettori ⋅ autovalori----------√.carichi=autovettori⋅autovalori.\text{Loadings} = \text{Eigenvectors} \cdot \sqrt{\text{Eigenvalues}}. So che gli autovettori sono solo direzioni e i caricamenti (come definiti sopra) includono anche la varianza lungo queste direzioni. Ma per una mia …
67 pca 


1
Quale correlazione rende singolare una matrice e quali sono le implicazioni della singolarità o della quasi-singolarità?
Sto facendo alcuni calcoli su matrici diverse (principalmente nella regressione logistica) e comunemente ottengo l'errore "Matrix is ​​singular", dove devo tornare indietro e rimuovere le variabili correlate. La mia domanda qui è cosa considereresti una matrice "altamente" correlata? Esiste un valore soglia di correlazione per rappresentare questa parola? Come se …


4
Guarda e troverai (una correlazione)
Ho diverse centinaia di misurazioni. Ora sto pensando di utilizzare un qualche tipo di software per correlare ogni misura con ogni misura. Ciò significa che ci sono migliaia di correlazioni. Tra questi ci dovrebbe essere (statisticamente) un'alta correlazione, anche se i dati sono completamente casuali (ogni misura ha solo circa …

7
Quanto da pagare? Un problema pratico
Questa non è una domanda di lavoro a domicilio ma un vero problema affrontato dalla nostra azienda. Molto recentemente (2 giorni fa) abbiamo ordinato a un rivenditore la produzione di 10000 etichette di prodotti. Il rivenditore è persona indipendente. Riceve le etichette prodotte dall'esterno e l'azienda effettua il pagamento al …

7
Perché ottimizzare la probabilità massima di registro anziché la probabilità
Nella maggior parte delle attività di apprendimento automatico in cui è possibile formulare alcune probabilità ppp che dovrebbero essere massimizzate, si dovrebbe effettivamente ottimizzare il registro probabilità logplog⁡p\log p invece della probabilità per alcuni parametri θθ\theta . Ad esempio, nella formazione di massima verosimiglianza, di solito è la verosimiglianza. Quando …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.