Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


3
Come derivare la matrice varianza-covarianza dei coefficienti nella regressione lineare
Sto leggendo un libro sulla regressione lineare e ho qualche problema a capire la matrice varianza-covarianza di :bb\mathbf{b} Gli elementi diagonali sono abbastanza facili, ma quelli fuori diagonale sono un po 'più difficili, ciò che mi è che σ(b0,b1)=E(b0b1)−E(b0)E(b1)=E(b0b1)−β0β1σ(b0,b1)=E(b0b1)−E(b0)E(b1)=E(b0b1)−β0β1 \sigma(b_0, b_1) = E(b_0 b_1) - E(b_0)E(b_1) = E(b_0 b_1) - …
36 regression 



6
Perché "spiegare" ha un senso intuitivo?
Di recente ho appreso un principio del ragionamento probabilistico chiamato " spiegare via " e sto cercando di coglierne un'intuizione. Vorrei creare uno scenario. Sia l'evento che si sta verificando un terremoto. Lascia che l'evento sia l'evento in cui il gigante jolly green sta passeggiando per la città. Lascia che …

3
Interpretazione del valore p nel test di ipotesi
Di recente mi sono imbattuto nel saggio "The Insignificance of Null Hypothesis Significance Testing", Jeff Gill (1999) . L'autore ha sollevato alcune idee sbagliate comuni riguardo al test di ipotesi e ai valori p, sui quali ho due domande specifiche: Il valore p è tecnicamente , che, come sottolineato dal …


4
Dove si trova
Una versione molto semplice del teorema centrale limitato come di seguito n−−√((1n∑i=1nXi)−μ) →d N(0,σ2)n((1n∑i=1nXi)−μ) →d N(0,σ2) \sqrt{n}\bigg(\bigg(\frac{1}{n}\sum_{i=1}^n X_i\bigg) - \mu\bigg)\ \xrightarrow{d}\ \mathcal{N}(0,\;\sigma^2) che è Lindeberg – Lévy CLT. Non capisco perché c'è unn−−√n\sqrt{n} sul lato sinistro. E Lyapunov CLT dice 1sn∑i=1n(Xi−μi) →d N(0,1)1sn∑i=1n(Xi−μi) →d N(0,1) \frac{1}{s_n} \sum_{i=1}^{n} (X_i - \mu_i) …





5
Sollevare la misura nel data mining
Ho cercato su molti siti Web per sapere cosa farà esattamente Lift? I risultati che ho trovato riguardavano il suo utilizzo in applicazioni non stesse. Conosco la funzione di supporto e fiducia. Da Wikipedia, nel data mining, l'ascensore è una misura delle prestazioni di un modello nel prevedere o classificare …


5
Funzioni di temporizzazione in R [chiuso]
Vorrei misurare il tempo necessario per ripetere l'esecuzione di una funzione. L' replicate()uso di for-loop è equivalente? Per esempio: system.time(replicate(1000, f())); system.time(for(i in 1:1000){f()}); Qual è il metodo preferito. Nell'output di system.time(), è sys+useril tempo effettivo della CPU per l'esecuzione del programma? È elapseduna buona misura della performance temporale del …
36 r 

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.