Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

4
Errore standard per la media di un campione di variabili casuali binomiali
Supponiamo che stia eseguendo un esperimento che può avere 2 risultati e suppongo che la distribuzione "vera" sottostante dei 2 risultati sia una distribuzione binomiale con parametri nnn e ppp : Binomial(n,p)Binomial(n,p){\rm Binomial}(n, p) . Posso calcolare l'errore standard, SEX=σXn√SEX=σXnSE_X = \frac{\sigma_X}{\sqrt{n}} , dalla forma della varianza di Binomial(n,p)Bionomioun'l(n,p){\rm Binomial}(n, …






3
I CDF sono più fondamentali dei PDF?
Il mio prof stat ha sostanzialmente detto, se dato uno dei seguenti tre, puoi trovare gli altri due: Funzione di distribuzione cumulativa Funzione di generazione del momento Densità di probabilità Ma il mio professore di econometria ha affermato che i CDF sono più fondamentali dei PDF perché ci sono esempi …
43 probability  pdf  cdf  mgf 

3
Strato di Softmax in una rete neurale
Sto cercando di aggiungere uno strato di softmax a una rete neurale addestrata con backpropagation, quindi sto provando a calcolare il suo gradiente. L'output di softmax è hj=ezj∑ezihj=ezj∑ezih_j = \frac{e^{z_j}}{\sum{e^{z_i}}} cuijjjè il numero di uscita neurone. Se lo ricavo, allora ottengo ∂hj∂zj=hj(1−hj)∂hj∂zj=hj(1−hj)\frac{\partial{h_j}}{\partial{z_j}}=h_j(1-h_j) Simile alla regressione logistica. Tuttavia, questo è sbagliato …


2
Presupposti casuali della foresta
Sono un po 'nuovo nella foresta casuale quindi sto ancora lottando con alcuni concetti di base. Nella regressione lineare, assumiamo osservazioni indipendenti, varianza costante ... Quali sono le ipotesi / ipotesi di base che facciamo quando usiamo la foresta casuale? Quali sono le differenze chiave tra foresta casuale e baia …



4
Compendio di tecniche di validazione incrociata
Mi chiedo se qualcuno sia a conoscenza di un compendio di tecniche di convalida incrociata con una discussione sulle differenze tra loro e una guida su quando usarle. Wikipedia ha un elenco delle tecniche più comuni, ma sono curioso di sapere se ci sono altre tecniche e se ci sono …

9
Minuscoli set di dati (reali) per fornire esempi in classe?
Quando insegno una lezione di livello introduttivo, gli insegnanti che conosco tendono a inventare alcuni numeri e una storia al fine di esemplificare il metodo che stanno insegnando. Quello che preferirei è raccontare una storia vera con numeri reali. Tuttavia, queste storie devono essere correlate a un set di dati …

3
Revisione delle statistiche sui documenti
Per alcuni di noi, i documenti di arbitrato fanno parte del lavoro. Per quanto riguarda l'arbitraggio di documenti di metodologia statistica, ritengo che i consigli di altre aree disciplinari siano abbastanza utili, ovvero informatica e matematica . Questa domanda riguarda la revisione di più documenti statistici applicati. Con questo intendo, …
43 journals  referee 

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.