Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

7
Perché le matrici simmetriche positive definite (SPD) sono così importanti?
Conosco la definizione di matrice simmetrica positiva definita (SPD), ma voglio capire di più. Perché sono così importanti, intuitivamente? Ecco quello che so. Cos'altro? Per un dato dato, la matrice di varianza è SPD. La matrice di varianza è una metrica importante, vedi questo eccellente post per una spiegazione intuitiva. …

1
Se il LASSO è equivalente alla regressione lineare con un Laplace precedente, come può esserci massa sui set con componenti a zero?
l o s s =∥y- Xβ∥22+ λ ∥ β∥1loss=‖y−Xβ‖22+λ‖β‖1 {\rm loss} = \| y - X \beta \|_2^2 + \lambda \| \beta \|_1 exp( - λ ∥ β∥1)exp⁡(−λ‖β‖1) \exp(-\lambda \| \beta \|_1 ) λλ\lambda Consideriamo che dal punto di vista bayesiano possiamo calcolare la probabilità posteriore che, per esempio, le …


5
Perché stiamo usando una formula di deviazione standard distorta e fuorviante per di una distribuzione normale?
Mi è sembrato un po 'scioccante la prima volta che ho fatto una normale simulazione Monte Carlo di distribuzione e ho scoperto che la media di deviazioni standard da campioni, tutti con una dimensione del campione di solo , si è rivelata molto inferiore rispetto alla media di volte, il …



1
Le spline possono essere utilizzate per la previsione?
Non posso essere specifico sulla natura dei dati in quanto sono proprietari, ma supponiamo di avere dati come questo: ogni mese, alcune persone si iscrivono per un servizio. Quindi, in ogni mese successivo, tali persone possono aggiornare il servizio, interrompere il servizio o essere negato il servizio (ad es. Per …




4
Libri di testo su Matrix Calculus?
Vedi questa domanda su Math SE . Racconto: ho letto Gli elementi dell'apprendimento statistico e sono rimasto frustrato quando stavo cercando di verificare alcuni dei risultati, ad esempio dato quindi RSS ( β) = ( y - X β)T( y - X β) ,RSS(β)=(y-Xβ)T(y-Xβ),\text{RSS}(\beta) = \left(\mathbf{y}-\mathbf{X}\beta\right)^{T}\left(\mathbf{y}-\mathbf{X}\beta\right)\text{,} Sto cercando un libro …

1
Esempi di vita reale dei processi decisionali di Markov
Ho visto molti video tutorial e sono uguali. Questo ad esempio: https://www.youtube.com/watch?v=ip4iSMRW5X4 Spiegano stati, azioni e probabilità che vanno bene. La persona lo spiega bene, ma non riesco proprio a capire cosa potrebbe essere utilizzato nella vita reale. Non ho ancora trovato alcun elenco. Quello più comune che vedo sono …


5
Dobbiamo ancora fare la selezione delle funzionalità durante l'utilizzo degli algoritmi di regolarizzazione?
Ho una domanda per quanto riguarda la necessità di utilizzare i metodi di selezione delle caratteristiche (le foreste casuali presentano un valore di importanza o i metodi di selezione delle caratteristiche univariati, ecc.) Prima di eseguire un algoritmo di apprendimento statistico. Sappiamo che per evitare un eccesso di adattamento possiamo …

1
Che cos'è "effetto ferro di cavallo" e / o "effetto arco" nell'analisi PCA / corrispondenza?
Esistono molte tecniche nelle statistiche ecologiche per l'analisi dei dati esplorativi di dati multidimensionali. Queste sono chiamate tecniche di 'ordinazione'. Molti sono uguali o strettamente correlati a tecniche comuni altrove nelle statistiche. Forse l'esempio prototipico sarebbe l'analisi dei componenti principali (PCA). Gli ecologi potrebbero usare la PCA e le relative …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.