Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Sto cercando di capire la storia della discesa del gradiente e della discesa del gradiente stocastico . La discesa a gradiente fu inventata a Cauchy nel 1847. Metodologia generale per la risoluzione dei sistemi simultanei . pp. 536–538 Per ulteriori informazioni a riguardo vedere qui . Da allora i metodi …
Questa è probabilmente una domanda amatoriale, ma sono interessato a come gli scienziati hanno ideato la forma della normale funzione di densità di probabilità di distribuzione? Fondamentalmente ciò che mi dà fastidio è che per qualcuno sarebbe forse più intuitivo che la funzione di probabilità dei dati normalmente distribuiti abbia …
Sto imparando l'analisi di sopravvivenza da questo post su UCLA IDRE e sono stato inciampato nella sezione 1.2.1. Il tutorial dice: ... se si sapesse che i tempi di sopravvivenza sono distribuiti in modo esponenziale , allora la probabilità di osservare un tempo di sopravvivenza ... Perché si presume che …
Ho cercato di apprendere i metodi MCMC e mi sono imbattuto nel campionamento di Metropolis Hastings, Gibbs, Importance e Rejection. Mentre alcune di queste differenze sono ovvie, cioè come Gibbs sia un caso speciale di Metropolis Hastings quando abbiamo i condizionali completi, le altre sono meno ovvie, come quando vogliamo …
Quando si utilizza la convalida incrociata per effettuare la selezione del modello (come ad esempio la regolazione dell'iperparametro) e per valutare le prestazioni del modello migliore, è necessario utilizzare la convalida incrociata nidificata . L'anello esterno serve per valutare le prestazioni del modello e l'anello interno deve selezionare il modello …
Il denominatore dello stimatore di varianza (imparziale) è quanto vi sono osservazioni e viene stimato solo un parametro.n−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} Allo stesso modo, mi chiedo perché il denominatore di covarianza non dovrebbe essere quando vengono stimati due parametri?n−2n−2n-2 Cov(X,Y)=∑ni=1(Xi−X¯¯¯¯)(Yi−Y¯¯¯¯)n−1Cov(X,Y)=∑i=1n(Xi−X¯)(Yi−Y¯)n−1 \mathbb{Cov}\left(X, Y\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)\left(Y_{i}-\overline{Y}\right)}{n-1}
Questo articolo " The Odds, continuamente aggiornato" dal NY Times è successo per attirare la mia attenzione. Per essere brevi, afferma che [Le statistiche bayesiane] si stanno rivelando particolarmente utili per affrontare problemi complessi, comprese ricerche come quella che la Guardia Costiera ha usato nel 2013 per trovare il pescatore …
EffectsIl pacchetto fornisce un modo molto veloce e conveniente per tracciare risultati di modelli a effetto misto lineare ottenuti attraverso il lme4pacchetto . La effectfunzione calcola gli intervalli di confidenza (IC) molto rapidamente, ma quanto sono affidabili questi intervalli di confidenza? Per esempio: library(lme4) library(effects) library(ggplot) data(Pastes) fm1 <- lmer(strength …
In questo attuale articolo di SCIENCE viene proposto quanto segue: Supponiamo di dividere casualmente 500 milioni di entrate tra 10.000 persone. C'è solo un modo per dare a tutti una quota pari a 50.000. Quindi, se stai distribuendo i guadagni in modo casuale, l'uguaglianza è estremamente improbabile. Ma ci sono …
Benjamini e Hochberg hanno sviluppato il primo (e ancora più ampiamente usato, credo) metodo per controllare il tasso di scoperta falsa (FDR). Voglio iniziare con un gruppo di valori P, ciascuno per un confronto diverso, e decidere quali sono abbastanza bassi da essere chiamati una "scoperta", controllando l'FDR su un …
Sto cercando di capire quale metodo di convalida incrociata è il migliore per la mia situazione. I seguenti dati sono solo un esempio di come risolvere il problema (in R), ma i miei Xdati reali ( xmat) sono correlati tra loro e correlati a diversi gradi con la yvariabile ( …
Sto cercando di creare un polinomio del secondo ordine adatto ad alcuni dati che ho. Diciamo che ho tracciato questo adattamento con ggplot(): ggplot(data, aes(foo, bar)) + geom_point() + geom_smooth(method="lm", formula=y~poly(x, 2)) Ottengo: Quindi, un secondo ordine funziona abbastanza bene. Lo calcolo con R: summary(lm(data$bar ~ poly(data$foo, 2))) E ottengo: …
Sto cercando di avvolgere la mia testa attorno alla differenza statistica tra analisi discriminante lineare e regressione logistica . Ho capito bene che, per un problema di classificazione di due classi , LDA prevede due funzioni di densità normale (una per ogni classe) che crea un confine lineare in cui …
Ho dati da 3 gruppi di biomassa di alghe ( AUNA , BBB , CCC ) che contengono campioni di dimensioni diverse ( nA=15nUN=15n_A=15 , nB=13nB=13n_B=13 , nC=12nC=12n_C=12 ) e vorrei fare un confronto se questi gruppi appartengono alla stessa popolazione . L'ANOVA a senso unico sarebbe sicuramente la strada …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.