Sto cercando di ottenere una comprensione intuitiva di come funziona l'analisi dei componenti principali (PCA) nello spazio soggetto (doppio) . Considerare un set di dati 2D con due variabili, x1x1x_1 e e punti dati (la matrice di dati è e si presume che sia centrata). La normale presentazione di PCA …
Considera l'identità elementare della varianza: Var(X)===E[(X−E[X])2]...E[X2]−(E[X])2Var(X)=E[(X−E[X])2]=...=E[X2]−(E[X])2 \begin{eqnarray} Var(X) &=& E[(X - E[X])^2]\\ &=& ...\\ &=& E[X^2] - (E[X])^2 \end{eqnarray} È una semplice manipolazione algebrica della definizione di un momento centrale in momenti non centrali. Consente una comoda manipolazione di in altri contesti. Consente inoltre il calcolo della varianza tramite un …
Ho visto e apprezzato la domanda Dare un senso all'analisi dei componenti principali e ora ho la stessa domanda per l'analisi indipendente dei componenti. Voglio dire, voglio fare una domanda completa sui modi intuitivi per comprendere l'ICA? Voglio capire esso. Voglio ottenerne lo scopo. Voglio averne la sensazione. Credo fermamente …
Ho letto qui che, dato un campione da una distribuzione continua con cdf F X , il campione corrispondente a U i = F X ( X i ) segue una distribuzione uniforme standard.X1,X2,...,XnX1,X2,...,Xn X_1,X_2,...,X_n FXFX F_X Ui=FX(Xi)Ui=FX(Xi) U_i = F_X(X_i) Ho verificato questo usando simulazioni qualitative in Python e …
Ho pensato di scrivere un post sul blog su questa interessante analisi di Kleinberg (2002) che esplora la difficoltà del clustering. Kleinberg delinea tre desideri apparentemente intuitivi per una funzione di raggruppamento e quindi dimostra che tale funzione non esiste. Esistono molti algoritmi di clustering che soddisfano due dei tre …
Ho lavorato con la convinzione che la mediana del campione sia una misura più robusta della tendenza centrale rispetto alla media del campione, poiché ignora i valori anomali. Sono stato quindi sorpreso di apprendere (nella risposta a un'altra domanda ) che per i campioni prelevati da una distribuzione normale, la …
Domande: qual è l'idea e l'intuizione alla base della stima della massima verosimiglianza (QMLE; noto anche come stima della pseudo massima verosimiglianza, PMLE)? Cosa fa funzionare lo stimatore quando la distribuzione dell'errore effettiva non corrisponde alla distribuzione dell'errore ipotizzata? Il sito di Wikipedia per QMLE va bene (breve, intuitivo, al …
Sono confuso riguardo all'equazione che funge da definizione della percentuale di rischio. Mi viene l'idea di quale sia il tasso di rischio, ma non vedo come l'equazione esprima quell'intuizione. Se è una variabile casuale che rappresenta il punto temporale della morte di qualcuno in un intervallo di tempo . Quindi …
Oggi ho insegnato a una classe introduttiva di statistica e uno studente mi ha fatto una domanda, che riformulo qui come: "Perché la deviazione standard è definita come sqrt di varianza e non come sqrt di somma dei quadrati su N?" Definiamo la varianza della popolazione:σ2=1N∑(xi−μ)2σ2=1N∑(xi−μ)2\sigma^2=\frac{1}{N}\sum{(x_i-\mu)^2} E deviazione standard: .σ=σ2−−√=1N√∑(xi−μ)2−−−−−−−−−−√σ=σ2=1N∑(xi−μ)2\sigma=\sqrt{\sigma^2}=\frac{1}{\sqrt{N}}\sqrt{\sum{(x_i-\mu)^2}} …
La procedura EM appare, ai non iniziati, come magia nera più o meno. Stimare i parametri di un HMM (ad esempio) utilizzando dati supervisionati. Quindi decodifica i dati senza tag, usando avanti-indietro per "contare" gli eventi come se i dati fossero taggati, più o meno. Perché questo rende il modello …
Ho letto molte volte che gli effetti casuali (BLUP / modalità condizionate per, per esempio, soggetti) non sono parametri di un modello lineare di effetti misti ma possono invece essere derivati dai parametri di varianza / covarianza stimati. Ad esempio Reinhold Kliegl et al. (2011) dichiara: Gli effetti casuali sono …
Nelle lezioni video di Harvard's Statistics 110: corso di probabilità che si possono trovare su iTunes e YouTube, ho riscontrato questo problema. Ho provato a sintetizzarlo qui: Supponiamo che ci venga data una mano casuale di due carte da un mazzo standard. Qual è la probabilità che entrambe le carte …
Per quanto ho capito, la correlazione della distanza è un modo solido e universale per verificare se esiste una relazione tra due variabili numeriche. Ad esempio, se abbiamo un insieme di coppie di numeri: (x1, y1) (x2, y2) ... (xn, yn) possiamo usare la correlazione della distanza per verificare se …
Nel libro di Steven Pinker Better Angels of Our Nature , lo osserva La probabilità è una questione di prospettiva. Visti a distanza sufficientemente ravvicinata, i singoli eventi hanno cause determinate. Anche il lancio di una moneta può essere previsto dalle condizioni di partenza e dalle leggi della fisica, e …
Quando consideriamo gli scenari della teoria delle code in cui gli individui arrivano a un nodo di servizio e fanno la coda, di solito viene utilizzato un processo di Poisson per modellare i tempi di arrivo. Questi scenari si presentano in problemi di routing di rete. Gradirei una spiegazione intuitiva …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.