Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Bene, la domanda dice tutto. Cosa si intende per "pre-allenamento di una rete neurale"? Qualcuno può spiegare in puro inglese semplice? Non riesco a trovare alcuna risorsa ad esso correlata. Sarebbe bello se qualcuno potesse indicarmi.
Sto studiando la stima della massima verosimiglianza e leggo che la funzione di verosimiglianza è il prodotto delle probabilità di ciascuna variabile. Perché è il prodotto? Perché non la somma? Ho cercato di cercare su Google ma non riesco a trovare risposte significative. https://en.wikipedia.org/wiki/Maximum_likelihood
Sono un appassionato di programmazione e apprendimento automatico. Solo pochi mesi fa ho iniziato a conoscere la programmazione dell'apprendimento automatico. Come molti che non hanno un background scientifico quantitativo, ho anche iniziato a imparare a parlare di ML armeggiando con gli algoritmi e i set di dati nel pacchetto ML …
Si afferma spesso che i test di permutazione non hanno ipotesi, tuttavia questo non è certamente vero. Ad esempio, se i miei campioni sono in qualche modo correlati, posso immaginare che permutare le loro etichette non sarebbe la cosa giusta da fare. Penso solo di aver scoperto questo problema è …
L'errore assoluto scalato medio (MASE) è una misura dell'accuratezza della previsione proposta da Koehler & Hyndman (2006) . MA SE= MA EMA Ei n - s a m p l e ,n a i v eMUNSE=MUNEMUNEion-Sun'mple,nun'ioveMASE=\frac{MAE}{MAE_{in-sample, \, naive}} dove è l'errore assoluto medio prodotto dalla previsione effettiva; mentre è l'errore …
Questa domanda è stata migrata dallo Stack Overflow perché è possibile rispondere su Convalida incrociata. Migrato 5 anni fa . Ho letto altri argomenti sui diagrammi di dipendenza parziale e la maggior parte di essi riguarda il modo in cui li complottate con pacchetti diversi, non come interpretarli accuratamente, quindi: …
La dichiarazione La distribuzione campionaria della varianza del campione è una distribuzione chi-quadrato con grado di libertà uguale a n−1n−1n-1 , dove nnn è la dimensione del campione (dato che la variabile casuale di interesse è normalmente distribuita). fonte La mia intuizione In un certo senso ha un senso intuitivo …
Abbiamo eseguito una regressione logistica a effetti misti utilizzando la sintassi seguente; # fit model fm0 <- glmer(GoalEncoding ~ 1 + Group + (1|Subject) + (1|Item), exp0, family = binomial(link="logit")) # model output summary(fm0) Oggetto e oggetto sono gli effetti casuali. Stiamo ottenendo un risultato dispari che è il coefficiente …
Ho dati storici sulle vendite di una panetteria (ogni giorno, oltre 3 anni). Ora voglio costruire un modello per prevedere le vendite future (utilizzando funzionalità come giorni feriali, variabili meteorologiche, ecc.). Come devo dividere il set di dati per adattare e valutare i modelli? Deve essere un treno cronologico / …
Perché è così comune ottenere stime della massima verosimiglianza dei parametri, ma non si sente praticamente mai delle stime dei parametri di verosimiglianza attese (cioè, basate sul valore atteso piuttosto che sulla modalità di una funzione di verosimiglianza)? Questo è principalmente per ragioni storiche o per ragioni tecniche o teoriche …
Quando eseguiamo esperimenti (su campioni di piccole dimensioni (di solito la dimensione del campione per gruppo di trattamento è di circa 7 ~ 8)) su due gruppi, utilizziamo un test t per verificare la differenza. Tuttavia, quando eseguiamo un ANOVA (ovviamente per più di due gruppi), usiamo qualcosa sulla falsariga …
Sappiamo che nel caso di un'adeguata distribuzione precedente, P(θ∣X)=P(X∣θ)P(θ)P(X)P(θ∣X)=P(X∣θ)P(θ)P(X)P(\theta \mid X) = \dfrac{P(X \mid \theta)P(\theta)}{P(X)} ∝P(X∣θ)P(θ)∝P(X∣θ)P(θ) \propto P(X \mid \theta)P(\theta) . La solita giustificazione per questo passaggio è che la distribuzione marginale di , , è costante rispetto a e può quindi essere ignorata quando si ottiene la distribuzione posteriore.XXXP(X)P(X)P(X)θθ\theta …
Quando inizio un'analisi esplorativa su un set di dati di grandi dimensioni (molti campioni, molte variabili), mi trovo spesso con centinaia di variabili derivate e tonnellate di grafici diversi e nessun modo reale per tenere traccia di ciò che sta andando dove. Il codice finisce come spaghetti, perché non c'è …
Recentemente ho letto del test U di Mann-Whitney. Si scopre che per eseguire questo test in R in realtà è necessario eseguire un test Wilcoxon! La mia domanda: la statistica W di wilcox.testin R è identica alla statistica U?
Ho una matrice semi-piccola di caratteristiche binarie di dimensione 250k x 100. Ogni riga è un utente e le colonne sono "tag" binari di alcuni comportamenti dell'utente, ad esempio "like_cats". user 1 2 3 4 5 ... ------------------------- A 1 0 1 0 1 B 0 1 0 1 0 …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.