Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
La sezione 1.7.2 di Rilevazione delle statistiche usando R di Andy Fields, et all, mentre elenca le virtù della media rispetto alla mediana, afferma: ... la media tende ad essere stabile in diversi campioni. Questo dopo aver spiegato le molte virtù della mediana, ad es ... La mediana non è …
C'è un thread simile qui (la funzione di costo della rete neurale non è convessa? ) Ma non sono stato in grado di capire i punti nelle risposte lì e il mio motivo per chiedere di nuovo sperando che questo chiarisca alcuni problemi: Se utilizzo somma di funzione di costo …
Sono curioso di sapere come i gradienti vengono retro-propagati attraverso una rete neurale usando i moduli ResNet / salta le connessioni. Ho visto un paio di domande su ResNet (ad es. Rete neurale con connessioni skip-layer ) ma questa fa domande specifiche sulla retro-propagazione dei gradienti durante l'allenamento. L'architettura di …
Domanda: Quando (per quali tipi di problemi di visualizzazione dei dati) le mappe di calore sono più efficaci? (In particolare, più efficace di tutte le altre tecniche di visualizzazione possibili?) Quando le mappe di calore sono meno efficaci? Esistono schemi o regole empirici comuni che è possibile utilizzare per decidere …
Stavo giocando con una semplice rete neurale con un solo livello nascosto, di Tensorflow, e poi ho provato diverse attivazioni per il livello nascosto: Relu sigmoid Softmax (beh, di solito softmax è usato nell'ultimo strato ..) Relu offre la migliore precisione e accuratezza di convalida del treno. Non sono sicuro …
Avendo incluso un modello di regressione quantile in un documento, i revisori vogliono che io includa aggiustato R2R2R^2 nel documento. Ho calcolato gli pseudo- s (dal documento JASA del 1999 di Koenker e Machado ) per i tre quantili di interesse per il mio studio.R2R2R^2 Tuttavia, non ho mai sentito …
So che per problemi regolari, se abbiamo uno stimatore imparziale regolare migliore, deve essere lo stimatore di massima verosimiglianza (MLE). Ma in generale, se abbiamo un MLE imparziale, sarebbe anche il miglior stimatore imparziale (o forse dovrei chiamarlo UMVUE, purché abbia la varianza più piccola)?
Andrew Gelman ha scritto un ampio articolo sul perché i test Bayesian AB non richiedono la correzione di ipotesi multiple: perché (di solito) non dobbiamo preoccuparci dei confronti multipli , 2012. Non capisco bene: perché i metodi bayesiani non richiedono più correzioni di test? A ~ Distribution1 + Common Distribution …
Alcune funzioni e approssimazioni di penalità sono ben studiate, come il LASSO ( ) e il Ridge ( ) e come si confrontano nella regressione.L1L1L_1L2L2L_2 Ho letto della penalità Bridge, che è la penalità generalizzata . Confrontalo con il LASSO, che ha \ gamma = 1 , e il Ridge, …
L'immagine seguente mostra una curva continua di tassi falsi positivi rispetto a tassi positivi reali: Tuttavia, ciò che non ottengo immediatamente è come vengono calcolate queste tariffe. Se un metodo viene applicato a un set di dati, ha un determinato tasso FP e un certo tasso FN. Ciò non significa …
Secondo la probabilità e le statistiche di Miller e Freund per gli ingegneri, 8ed (pp.217-218), la funzione di probabilità da massimizzare per la distribuzione binomiale (prove di Bernoulli) è data come L ( p ) = ∏ni = 1pXio( 1 - p )1 - xioL(p)=Πio=1npXio(1-p)1-XioL(p) = \prod_{i=1}^np^{x_i}(1-p)^{1-x_i} Come arrivare a …
Questa domanda è un po 'a sinistra, ma ho pensato che la comunità qui probabilmente abbia una visione forte dell'argomento! Sto scrivendo la mia tesi di dottorato. Coerentemente, parlando di quantità che sono formalmente correlate a una distribuzione gaussiana, ho fatto in maiuscolo la "N" in "Normale" per riferirle. Ad …
Durante l'allenamento di una rete neurale mediante l'algoritmo di retro-propagazione, il metodo di discesa del gradiente viene utilizzato per determinare gli aggiornamenti del peso. La mia domanda è: anziché utilizzare il metodo di discesa gradiente per individuare lentamente il punto minimo rispetto a un determinato peso, perché non impostare semplicemente …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.