Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Dato un modello gerarchico , voglio che un processo in due fasi si adatti al modello. Innanzitutto, correggi una manciata di iperparametri , quindi fai l'inferenza bayesiana sul resto dei parametri . Per correggere gli iperparametri sto prendendo in considerazione due opzioni.p ( x | ϕ , θ )p(X|φ,θ)p(x|\phi,\theta)θθ\thetaφφ\phi Usa …
Ho due proporzioni (ad esempio, percentuale di clic (CTR) su un collegamento in un layout di controllo e CTR su un collegamento in un layout sperimentale) e voglio calcolare un intervallo di confidenza del 95% attorno al rapporto di queste proporzioni. Come faccio a fare questo? So di poter usare …
Ho due popolazioni (uomini e donne), ognuna contenente campioni. Per ogni campione ho due proprietà A e B (media del primo anno e punteggio SAT). Ho usato un test t separatamente per A & B: entrambi hanno trovato differenze significative tra i due gruppi; A con e B con .100010001000p …
In un'impostazione in cui si osserva X1,…,XnX1,…,XnX_1,\ldots,X_n distribuito da una distribuzione con densità fff , mi chiedo se esiste uno stimatore imparziale (basato sulla XiXiX_i ) della distanza di Hellinger ad un'altra distribuzione con densità f0f0f_0 , vale a dire H(f,f0)={1−∫Xf(x)f0(x)−−−−−−−−√dx}1/2.H(f,f0)={1−∫Xf(x)f0(x)dx}1/2. \mathfrak{H}(f,f_0) = \left\{ 1 - \int_\mathcal{X} \sqrt{f(x)f_0(x)} \text{d}x \right\}^{1/2}\,.
Sono un po 'nuovo nel datamining / machine learning / ecc. e ho letto un paio di modi per combinare più modelli ed esecuzioni dello stesso modello per migliorare le previsioni. La mia impressione dalla lettura di un paio di articoli (che sono spesso interessanti e ottimi per la teoria …
(Per capire perché l'ho scritto, controlla i commenti sotto la mia risposta a questa domanda .) Errori di tipo III e teoria delle decisioni statistiche Dare la risposta giusta alla domanda sbagliata è talvolta chiamato errore di tipo III. La teoria delle decisioni statistiche è una formalizzazione del processo decisionale …
Ho due domande sulla nozione di blocco nella progettazione sperimentale: (1) Qual è la differenza tra un blocco e un fattore? (2) Ho provato a leggere alcuni libri ma qualcosa non è chiaro: sembra che gli autori presumano sempre che non vi sia interazione tra il "fattore di blocco" e …
Sto usando la libreria caretin R per testare varie procedure di modellazione. L' trainControloggetto consente di specificare un metodo di ricampionamento. I metodi sono descritti nella documentazione di sezione 2.3 ed includono: boot, boot632, cv, LOOCV, LGOCV, repeatedcve oob. Sebbene alcuni di questi siano facili da dedurre, non tutti questi …
Qualcuno potrebbe avvisare se ha senso quanto segue: Ho a che fare con un normale modello lineare con 4 predittori. Ho due menti se abbandonare il termine meno significativo. Il valore è leggermente superiore a 0,05. Ho discusso a favore di lasciarlo cadere in questo modo: moltiplicare la stima di …
Due approcci comuni per la selezione di variabili correlate sono i test di significatività e la validazione incrociata. Quale problema ciascuno cerca di risolvere e quando preferirei l'uno all'altro?
Qualcuno può indicarmi un documento del sondaggio sui risultati "Grande , Piccola n "? Sono interessato a come questo problema si manifesta in diversi contesti di ricerca, ad esempio regressione, classificazione, test di Hotelling, ecc .pppnnn
Ho esaminato la modellazione di effetti misti usando il pacchetto lme4 in R. Uso principalmente il lmercomando, quindi porrò la mia domanda attraverso il codice che usa quella sintassi. Suppongo che potrebbe essere una domanda semplice generale, è corretto confrontare due modelli costruiti lmerutilizzando rapporti di probabilità basati su set …
Quindi questa è una scelta strana, anche se in realtà penso che sia una strana misura per qualsiasi sito, quindi ho pensato di provarlo qui, tra i miei fratelli scricchiolanti di dati. Sono venuto all'epidemiologia e alla biostatistica dalla biologia, e sicuramente ho ancora alcune abitudini da quel campo. Uno …
Ho sempre pensato alla regressione logistica come semplicemente un caso speciale di regressione binomiale in cui la funzione di collegamento è la funzione logistica (anziché, diciamo, una funzione probit). Dalla lettura delle risposte su un'altra domanda che ho avuto, tuttavia, sembra che potrei essere confuso, e c'è una differenza tra …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.