Statistiche e Big Data

5

Cosa devo fare quando la mia rete neurale non impara?

Sto allenando una rete neurale ma la perdita di allenamento non diminuisce. Come posso risolvere questo problema? Non sto chiedendo di adattamento eccessivo o regolarizzazione. Sto chiedendo come risolvere il problema in cui le prestazioni della mia rete non migliorano sul set di formazione . Questa domanda è intenzionalmente generale …

148 neural-networks deep-learning

6

L'analisi dei componenti principali può essere applicata a set di dati contenenti una combinazione di variabili continue e categoriali?

Ho un set di dati che contiene sia dati continui che categorici. Sto analizzando usando PCA e mi chiedo se sia giusto includere le variabili categoriali come parte dell'analisi. La mia comprensione è che PCA può essere applicato solo a variabili continue. È corretto? Se non può essere utilizzato per …

147 categorical-data pca correspondence-analysis mixed-type-data

7

Quale spiegazione intuitiva esiste per il teorema del limite centrale?

In diversi contesti invochiamo il teorema del limite centrale per giustificare qualsiasi metodo statistico che vogliamo adottare (ad esempio, approssimare la distribuzione binomiale con una distribuzione normale). Comprendo i dettagli tecnici sul perché il teorema è vero, ma solo ora mi è venuto in mente che non capisco davvero l'intuizione …

144 intuition central-limit-theorem

25

R vs SAS, perché SAS è preferito dalle società private?

Ho imparato R ma sembra che le aziende siano molto più interessate all'esperienza SAS. Quali sono i vantaggi di SAS rispetto a R?

143 r sas

6

Quali sono i vantaggi di ReLU rispetto alla funzione sigmoide nelle reti neurali profonde?

Lo stato dell'arte della non linearità consiste nell'utilizzare unità lineari rettificate (ReLU) invece della funzione sigmoide nella rete neurale profonda. Quali sono i vantaggi? So che addestrare una rete quando si utilizza ReLU sarebbe più veloce ed è più ispirato al biologico, quali sono gli altri vantaggi? (Cioè, eventuali svantaggi …

141 machine-learning neural-networks deep-learning

5

In che modo esattamente un "controllo per altre variabili"?

Ecco l'articolo che ha motivato questa domanda: l' impazienza ci fa ingrassare? Questo articolo mi è piaciuto e dimostra chiaramente il concetto di "controllo per altre variabili" (QI, carriera, reddito, età, ecc.) Al fine di isolare al meglio la vera relazione tra solo le 2 variabili in questione. Puoi spiegarmi …

141 regression causality confounding controlling-for-a-variable statistics-in-media

5

Allenarsi con il set di dati completo dopo la convalida incrociata?

È sempre una buona idea allenarsi con il set di dati completo dopo la convalida incrociata ? Dirla in altro modo, è ok per allenarsi con tutti i campioni nel mio set di dati e non essere in grado di verificare se questo particolare montaggio overfits ? Alcuni retroscena sul …

140 machine-learning cross-validation model-selection

14

Intervista su Amazon: probabilità della seconda intervista

Ho ricevuto questa domanda durante un'intervista con Amazon: Il 50% di tutte le persone che ricevono un primo colloquio riceve un secondo colloquio Il 95% dei tuoi amici che hanno ottenuto una seconda intervista ritiene di avere avuto una buona prima intervista Il 75% dei tuoi amici che NON ha …

139 probability conditional-probability

8

Facebook sta per finire?

Recentemente, questo documento ha ricevuto molta attenzione (ad esempio da WSJ ). Fondamentalmente, gli autori concludono che Facebook perderà l'80% dei suoi membri entro il 2017. Basano le loro affermazioni su un'estrapolazione del modello SIR , un modello compartimentale spesso utilizzato in epidemiologia. I loro dati sono tratti dalle ricerche …

138 hypothesis-testing correlation epidemiology social-network

4

Scelta di K nella validazione incrociata di K-fold

Sto usando il fold convalida incrociata un paio di volte per valutare le prestazioni di alcuni algoritmi di apprendimento, ma sono sempre stato perplesso su come dovrei scegliere il valore di .KKKKKKK Ho spesso visto e usato un valore di , ma questo mi sembra del tutto arbitrario, e ora …

136 machine-learning classification cross-validation

15

Spiegazione intuitiva per la divisione per

Mi è stato chiesto oggi in classe perché dividere la somma dell'errore quadrato per anziché con , quando si calcola la deviazione standard.nn - 1n−1n-1nnn Ho detto che non risponderò in classe (dal momento che non volevo entrare in stimatori imparziali), ma più tardi mi sono chiesto - c'è una …

136 standard-error intuition teaching bessels-correction

7

Qual è l'influenza di C in SVM con kernel lineare?

Attualmente sto usando un SVM con un kernel lineare per classificare i miei dati. Non ci sono errori sul set di allenamento. Ho provato diversi valori per il parametro ( ). Ciò non ha modificato l'errore sul set di test.10 - 5 , … , 10 2CCC10- 5, ... , …

134 machine-learning svm libsvm

2

Un elenco di funzioni di costo utilizzate nelle reti neurali, insieme alle applicazioni

Quali sono le funzioni di costo comuni utilizzate nella valutazione delle prestazioni delle reti neurali? Dettagli (sentiti libero di saltare il resto di questa domanda, il mio intento qui è semplicemente quello di fornire chiarimenti sulla notazione che le risposte possono usare per aiutarli a essere più comprensibili per il …

133 machine-learning neural-networks

5

Qual è la differenza tra l'analisi dei componenti principali e il ridimensionamento multidimensionale?

In cosa differiscono PCA e MDS classico? Che ne dici di MDS contro MDS non metrico? C'è un momento in cui preferiresti l'uno all'altro? In cosa differiscono le interpretazioni?

133 pca multidimensional-scaling pcoa

2

Come determinare quale distribuzione si adatta meglio ai miei dati?

Ho un set di dati e vorrei capire quale distribuzione si adatta meglio ai miei dati. Ho usato la fitdistr()funzione per stimare i parametri necessari per descrivere la distribuzione presunta (cioè Weibull, Cauchy, Normal). Usando questi parametri posso condurre un test di Kolmogorov-Smirnov per stimare se i miei dati del …

133 r distributions goodness-of-fit kolmogorov-smirnov distribution-identification