Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Sto allenando una rete neurale ma la perdita di allenamento non diminuisce. Come posso risolvere questo problema? Non sto chiedendo di adattamento eccessivo o regolarizzazione. Sto chiedendo come risolvere il problema in cui le prestazioni della mia rete non migliorano sul set di formazione . Questa domanda è intenzionalmente generale …
Ho un set di dati che contiene sia dati continui che categorici. Sto analizzando usando PCA e mi chiedo se sia giusto includere le variabili categoriali come parte dell'analisi. La mia comprensione è che PCA può essere applicato solo a variabili continue. È corretto? Se non può essere utilizzato per …
In diversi contesti invochiamo il teorema del limite centrale per giustificare qualsiasi metodo statistico che vogliamo adottare (ad esempio, approssimare la distribuzione binomiale con una distribuzione normale). Comprendo i dettagli tecnici sul perché il teorema è vero, ma solo ora mi è venuto in mente che non capisco davvero l'intuizione …
Lo stato dell'arte della non linearità consiste nell'utilizzare unità lineari rettificate (ReLU) invece della funzione sigmoide nella rete neurale profonda. Quali sono i vantaggi? So che addestrare una rete quando si utilizza ReLU sarebbe più veloce ed è più ispirato al biologico, quali sono gli altri vantaggi? (Cioè, eventuali svantaggi …
Ecco l'articolo che ha motivato questa domanda: l' impazienza ci fa ingrassare? Questo articolo mi è piaciuto e dimostra chiaramente il concetto di "controllo per altre variabili" (QI, carriera, reddito, età, ecc.) Al fine di isolare al meglio la vera relazione tra solo le 2 variabili in questione. Puoi spiegarmi …
È sempre una buona idea allenarsi con il set di dati completo dopo la convalida incrociata ? Dirla in altro modo, è ok per allenarsi con tutti i campioni nel mio set di dati e non essere in grado di verificare se questo particolare montaggio overfits ? Alcuni retroscena sul …
Ho ricevuto questa domanda durante un'intervista con Amazon: Il 50% di tutte le persone che ricevono un primo colloquio riceve un secondo colloquio Il 95% dei tuoi amici che hanno ottenuto una seconda intervista ritiene di avere avuto una buona prima intervista Il 75% dei tuoi amici che NON ha …
Recentemente, questo documento ha ricevuto molta attenzione (ad esempio da WSJ ). Fondamentalmente, gli autori concludono che Facebook perderà l'80% dei suoi membri entro il 2017. Basano le loro affermazioni su un'estrapolazione del modello SIR , un modello compartimentale spesso utilizzato in epidemiologia. I loro dati sono tratti dalle ricerche …
Sto usando il fold convalida incrociata un paio di volte per valutare le prestazioni di alcuni algoritmi di apprendimento, ma sono sempre stato perplesso su come dovrei scegliere il valore di .KKKKKKK Ho spesso visto e usato un valore di , ma questo mi sembra del tutto arbitrario, e ora …
Mi è stato chiesto oggi in classe perché dividere la somma dell'errore quadrato per anziché con , quando si calcola la deviazione standard.nn - 1n−1n-1nnn Ho detto che non risponderò in classe (dal momento che non volevo entrare in stimatori imparziali), ma più tardi mi sono chiesto - c'è una …
Attualmente sto usando un SVM con un kernel lineare per classificare i miei dati. Non ci sono errori sul set di allenamento. Ho provato diversi valori per il parametro ( ). Ciò non ha modificato l'errore sul set di test.10 - 5 , … , 10 2CCC10- 5, ... , …
Quali sono le funzioni di costo comuni utilizzate nella valutazione delle prestazioni delle reti neurali? Dettagli (sentiti libero di saltare il resto di questa domanda, il mio intento qui è semplicemente quello di fornire chiarimenti sulla notazione che le risposte possono usare per aiutarli a essere più comprensibili per il …
In cosa differiscono PCA e MDS classico? Che ne dici di MDS contro MDS non metrico? C'è un momento in cui preferiresti l'uno all'altro? In cosa differiscono le interpretazioni?
Ho un set di dati e vorrei capire quale distribuzione si adatta meglio ai miei dati. Ho usato la fitdistr()funzione per stimare i parametri necessari per descrivere la distribuzione presunta (cioè Weibull, Cauchy, Normal). Usando questi parametri posso condurre un test di Kolmogorov-Smirnov per stimare se i miei dati del …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.