Statistiche e Big Data

10

Perché non scaricare le reti neurali e l'apprendimento profondo? [chiuso]

Chiuso . Questa domanda è basata sull'opinione . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che possa essere risolta con fatti e citazioni modificando questo post . Chiuso 2 anni fa . Problema fondamentale con l'apprendimento profondo e le reti neurali in generale. …

25 machine-learning neural-networks svm deep-learning

3

LASSO con termini di interazione: va bene se gli effetti principali sono ridotti a zero?

La regressione di LASSO riduce i coefficienti verso zero, fornendo così un'efficace selezione del modello. Credo che nei miei dati vi siano interazioni significative tra covariate nominali e continue. Non necessariamente, tuttavia, gli "effetti principali" del modello reale sono significativi (diversi da zero). Ovviamente non lo so poiché il vero …

25 machine-learning lasso glmnet shrinkage penalized

3

Quali sono i vantaggi di impilare più LSTM?

Quali sono i vantaggi, perché si dovrebbero usare più LSTM, accatastati uno accanto all'altro, in una rete profonda? Sto usando un LSTM per rappresentare una sequenza di input come un singolo input. Quindi una volta che ho quella singola rappresentazione, perché dovrei passarla di nuovo? Lo sto chiedendo perché l'ho …

25 classification neural-networks deep-learning lstm rnn

1

C'è un risultato che fornisce che il bootstrap è valido se e solo se la statistica è liscia?

In tutto assumiamo che la nostra statistica sia una funzione di alcuni dati che è tratto dalla funzione di distribuzione ; la funzione di distribuzione empirica del nostro campione è . Quindi è la statistica vista come una variabile casuale e è la versione bootstrap della statistica. Usiamo come distanza …

25 probability mathematical-statistics bootstrap asymptotics consistency

1

Perché le unità lineari rettificate sono considerate non lineari?

Perché le funzioni di attivazione delle unità lineari rettificate (ReLU) sono considerate non lineari? f( x ) = max ( 0 , x )f(x)=max(0,x) f(x) = \max(0,x) Sono lineari quando l'input è positivo e dalla mia comprensione per sbloccare il potere rappresentativo delle reti profonde, le attivazioni non lineari sono …

25 neural-networks deep-learning

5

Algoritmi di machine learning per gestire i dati mancanti

Sto cercando di sviluppare un modello predittivo utilizzando dati clinici ad alta dimensione, compresi i valori di laboratorio. Lo spazio dati è scarso con 5k campioni e 200 variabili. L'idea è quella di classificare le variabili utilizzando un metodo di selezione delle funzionalità (IG, RF ecc.) E utilizzare funzionalità di …

25 machine-learning missing-data

2

Attingendo dalla distribuzione di Dirichlet

Diciamo che abbiamo una distribuzione di Dirichlet con parametro vettoriale tridimensionale . Come posso disegnare un campione (un vettore tridimensionale ) da questa distribuzione? Ho bisogno di una (forse) semplice spiegazione.KKKα⃗ =[α1,α2,...,αK]α→=[α1,α2,...,αK]\vec\alpha = [\alpha_1, \alpha_2,...,\alpha_K]KKK

25 sampling dirichlet-distribution

4

Funzioni di variabili casuali indipendenti

L'affermazione che le funzioni di variabili casuali indipendenti sono esse stesse indipendenti, vere? Ho visto quel risultato spesso usato implicitamente in alcune prove, ad esempio nella prova di indipendenza tra la media del campione e la varianza del campione di una distribuzione normale, ma non sono stato in grado di …

25 probability self-study random-variable independence

2

Intuizione dietro la regressione logistica

Di recente ho iniziato a studiare l'apprendimento automatico, ma non sono riuscito a cogliere l'intuizione alla base della regressione logistica . Di seguito sono riportati i fatti sulla regressione logistica che capisco. Come base per l'ipotesi usiamo la funzione sigmoide . Capisco perché è una scelta corretta, tuttavia perché è …

25 regression machine-learning logistic

5

Dovresti mai standardizzare le variabili binarie?

Ho un set di dati con un set di funzionalità. Alcuni di essi sono binari attivo o attivato, inattivo o inattivo) e il resto ha un valore reale, ad esempio .( 1 =(1=(1=0 =0=0=4564.3424564.3424564.342 Voglio fornire questi dati a un algoritmo di apprendimento automatico, quindi ho eseguito il punteggio tutte …

25 machine-learning normalization binary-data

3

In che modo i bayesiani confrontano le distribuzioni?

Quindi, penso di avere una buona conoscenza delle basi della probabilità frequentista e dell'analisi statistica (e di quanto male possa essere usato). In un mondo frequentista, ha senso porre una domanda come "questa distribuzione è diversa da quella distribuzione", perché si presume che le distribuzioni siano reali, oggettive e immutabili …

25 distributions bayesian

1

Deviazione standard delle osservazioni integrate

Ho un set di dati di osservazioni campione, memorizzate come conteggi all'interno dei contenitori di intervallo. per esempio: min/max count 40/44 1 45/49 2 50/54 3 55/59 4 70/74 1 Ora, trovare una stima della media da questo è abbastanza semplice. Basta usare la media (o mediana) di ciascun intervallo …

25 variance standard-deviation weighted-sampling

3

Curva ROC per classificatori discreti come SVM: Perché la chiamiamo ancora una "curva"? Non è solo un "punto"?

Nella discussione: come generare una curva roc per la classificazione binaria , penso che la confusione fosse che un "classificatore binario" (che è qualsiasi classificatore che separa 2 classi) era per Yang quello che viene chiamato un "classificatore discreto" (che produce uscite discrete 0/1 come un SVM) e non uscite …

25 cross-validation roc auc

1

Come funziona la convalida incrociata Leave-one-out? Come selezionare il modello finale da modelli diversi?

Ho alcuni dati e voglio costruire un modello (per esempio un modello di regressione lineare) da questi dati. Nel prossimo passaggio, voglio applicare il modello di convalida incrociata (LOOCV) Leave-One-Out sul modello, quindi guarda quanto funziona bene. Se ho capito bene LOOCV, ho creato un nuovo modello per ciascuno dei …

25 cross-validation

1

Matrici casuali con vincoli sulla lunghezza di riga e colonna

Devo generare matrici casuali non quadrate con righe e colonne C , elementi distribuiti casualmente con media = 0 e vincolati in modo tale che la lunghezza (norma L2) di ogni riga sia 1 e la lunghezza di ogni colonna sia √RRRCCC111 . Equivalentemente, la somma dei valori quadrati è …

25 random-generation normalization markov-process random-matrix