Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


1
Le statistiche di convalida incrociata (CV) e di convalida incrociata generalizzata (GCV)
Ho trovato definizioni forse contrastanti per la statistica di convalida incrociata (CV) e per la statistica di convalida incrociata generalizzata (GCV) associata a un modello lineare Y=Xβ+εY=Xβ+εY = X\boldsymbol\beta + \boldsymbol\varepsilon (con un vettore di errore omoscedastico normale εε\boldsymbol\varepsilon ). Da un lato, Golub, Heath & Wahba definiscono la stima …

5
Ora che ho respinto l'ipotesi nulla, quale sarà il prossimo?
Ho ripetutamente respinto o non sono riuscito a respingere l'ipotesi nulla. Nel caso in cui non si respinga il caso, si conclude che non ci sono prove sufficienti per il rifiuto e si "passa" (ovvero, raccogliere più dati, terminare l'esperimento ecc.) Ma quando "fai" respingi l'ipotesi nulla, fornendo alcune prove …



2
CHAID vs CRT (o CART)
Sto eseguendo una classificazione dell'albero decisionale utilizzando SPSS su un set di dati con circa 20 predittori (categorico con poche categorie). CHAID (Rilevazione automatica dell'interazione Chi-quadrato) e CRT / CART (alberi di classificazione e regressione) mi danno alberi diversi. Qualcuno può spiegare i meriti relativi di CHAID vs CRT? Quali …
23 spss  cart 




2
Come gestire la differenza tra la distribuzione del set di test e il set di allenamento?
Penso che un'ipotesi di base dell'apprendimento automatico o della stima dei parametri sia che i dati invisibili provengano dalla stessa distribuzione dell'insieme di formazione. Tuttavia, in alcuni casi pratici, la distribuzione del set di test sarà quasi diversa dal set di training. Supponiamo che si tratti di un problema di …

3
Studente t come miscela di gaussiano
Utilizzando la distribuzione t dello studente con k>0k>0k > 0 gradi di libertà, il parametro di posizione e il parametro di scala hanno densitàslllsss Γ(k+12)Γ(k2kπs2−−−−√){1+k−1(x−ls)}−(k+1)/2,Γ(k+12)Γ(k2kπs2){1+k−1(x−ls)}−(k+1)/2,\frac{\Gamma \left(\frac{k+1}{2}\right)}{\Gamma\left(\frac{k}{2}\sqrt{k \pi s^2}\right)} \left\{ 1 + k^{-1}\left( \frac{x-l}{s}\right)\right\}^{-(k+1)/2}, come dimostrare che la distribuzione Student può essere scritta come una miscela di distribuzioni gaussiane lasciando , …

2
Media battuta bayesiana prima
Volevo porre una domanda ispirata a un'eccellente risposta all'interrogazione sull'intuizione per la distribuzione beta. Volevo capire meglio la derivazione per la distribuzione precedente per la media battuta. Sembra che David stia ritirando i parametri dalla media e dall'intervallo. Partendo dal presupposto che la media sia e la deviazione standard sia …
23 bayesian  prior 




Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.