Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Supponiamo che stia eseguendo un esperimento che può avere 2 risultati e suppongo che la distribuzione "vera" sottostante dei 2 risultati sia una distribuzione binomiale con parametri nnn e ppp : Binomial(n,p)Binomial(n,p){\rm Binomial}(n, p) . Posso calcolare l'errore standard, SEX=σXn√SEX=σXnSE_X = \frac{\sigma_X}{\sqrt{n}} , dalla forma della varianza di Binomial(n,p)Bionomioun'l(n,p){\rm Binomial}(n, …
Ho capito che la foresta casuale e gli alberi estremamente casuali differiscono nel senso che le spaccature degli alberi nella foresta casuale sono deterministiche mentre sono casuali nel caso di alberi estremamente casuali (per essere più precisi, la divisione successiva è la divisione migliore tra le divisioni casuali uniformi nelle …
Ho notato che ci sono alcune implementazioni di foreste casuali come ALGLIB, Waffles e alcuni pacchetti R come randomForest. Qualcuno può dirmi se queste librerie sono altamente ottimizzate? Sono sostanzialmente equivalenti alle foreste casuali descritte in dettaglio in The Elements of Statistical Learning o sono stati aggiunti molti trucchi extra? …
Voglio imparare le reti neurali. Sono un linguista computazionale. Conosco approcci statistici di machine learning e posso programmare in Python. Sto cercando di iniziare con i suoi concetti e conoscere uno o due modelli popolari che possono essere utili dal punto di vista della linguistica computazionale. Ho navigato sul web …
Qualcuno può spiegare come le proprietà dei registri lo rendono in modo da poter fare le regressioni lineari in cui i coefficienti sono interpretati come variazioni percentuali?
Ho un hash SHA256 di 64 caratteri. Spero di formare un modello in grado di prevedere se il testo in chiaro utilizzato per generare l'hash inizia con un 1 o meno. Indipendentemente se questo è "Possibile", quale algoritmo sarebbe l'approccio migliore? I miei pensieri iniziali: Genera un grande campione di …
Il mio prof stat ha sostanzialmente detto, se dato uno dei seguenti tre, puoi trovare gli altri due: Funzione di distribuzione cumulativa Funzione di generazione del momento Densità di probabilità Ma il mio professore di econometria ha affermato che i CDF sono più fondamentali dei PDF perché ci sono esempi …
Sto cercando di aggiungere uno strato di softmax a una rete neurale addestrata con backpropagation, quindi sto provando a calcolare il suo gradiente. L'output di softmax è hj=ezj∑ezihj=ezj∑ezih_j = \frac{e^{z_j}}{\sum{e^{z_i}}} cuijjjè il numero di uscita neurone. Se lo ricavo, allora ottengo ∂hj∂zj=hj(1−hj)∂hj∂zj=hj(1−hj)\frac{\partial{h_j}}{\partial{z_j}}=h_j(1-h_j) Simile alla regressione logistica. Tuttavia, questo è sbagliato …
Capisco che la definizione base di endogeneità è che non è soddisfatto, ma cosa significa questo in un senso del mondo reale? Ho letto l'articolo di Wikipedia, con l'esempio della domanda e dell'offerta, cercando di dargli un senso, ma non mi è stato di grande aiuto. Ho sentito l'altra descrizione …
Sono un po 'nuovo nella foresta casuale quindi sto ancora lottando con alcuni concetti di base. Nella regressione lineare, assumiamo osservazioni indipendenti, varianza costante ... Quali sono le ipotesi / ipotesi di base che facciamo quando usiamo la foresta casuale? Quali sono le differenze chiave tra foresta casuale e baia …
Considero il problema della classificazione (multiclasse) in base a serie temporali di lunghezza variabile , ovvero trovare una funzione tramite una rappresentazione globale della serie temporale da un set di funzioni selezionate di dimensione fissa indipendente da , quindi utilizzare i metodi di classificazione standard su questo set di funzionalità. …
Sto cercando un modo per generare numeri casuali che sembrano distribuiti in modo uniforme - e ogni test mostrerà che sono uniformi - tranne per il fatto che sono distribuiti in modo più uniforme rispetto ai dati uniformi reali . Il problema che ho con i "veri" randoms uniformi è …
Mi chiedo se qualcuno sia a conoscenza di un compendio di tecniche di convalida incrociata con una discussione sulle differenze tra loro e una guida su quando usarle. Wikipedia ha un elenco delle tecniche più comuni, ma sono curioso di sapere se ci sono altre tecniche e se ci sono …
Quando insegno una lezione di livello introduttivo, gli insegnanti che conosco tendono a inventare alcuni numeri e una storia al fine di esemplificare il metodo che stanno insegnando. Quello che preferirei è raccontare una storia vera con numeri reali. Tuttavia, queste storie devono essere correlate a un set di dati …
Per alcuni di noi, i documenti di arbitrato fanno parte del lavoro. Per quanto riguarda l'arbitraggio di documenti di metodologia statistica, ritengo che i consigli di altre aree disciplinari siano abbastanza utili, ovvero informatica e matematica . Questa domanda riguarda la revisione di più documenti statistici applicati. Con questo intendo, …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.