Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Ho costruito una regressione logistica in cui la variabile di risultato viene curata dopo aver ricevuto il trattamento ( Curevs. No Cure). Tutti i pazienti in questo studio hanno ricevuto un trattamento. Sono interessato a vedere se il diabete è associato a questo risultato. In R il mio output di …
Citando uno degli autori: t-Distributed Stochastic Neighbor Embedding (t-SNE) è una tecnica ( premiata ) per la riduzione della dimensionalità che è particolarmente adatta per la visualizzazione di set di dati ad alta dimensione. Quindi suona abbastanza bene, ma è l'autore a parlare. Un'altra citazione dell'autore (in riferimento al suddetto …
Ho eseguito l'analisi dei componenti principali (PCA) con R usando due diverse funzioni ( prcompe princomp) e ho osservato che i punteggi PCA differivano nel segno. Come può essere? Considera questo: set.seed(999) prcomp(data.frame(1:10,rnorm(10)))$x PC1 PC2 [1,] -4.508620 -0.2567655 [2,] -3.373772 -1.1369417 [3,] -2.679669 1.0903445 [4,] -1.615837 0.7108631 [5,] -0.548879 0.3093389 …
Mi chiedevo che differenza e relazione ci sono tra previsione e previsione? Soprattutto nelle serie storiche e nella regressione? Ad esempio, ho ragione che: Nelle serie storiche, la previsione sembra significare stimare i valori futuri dati i valori passati di una serie storica. In regressione, la previsione sembra significare stimare …
Esistono diverse tecniche di ricampionamento popolari, che vengono spesso utilizzate nella pratica, come bootstrap, test di permutazione, coltello a serramanico, ecc. Ci sono numerosi articoli e libri che discutono di queste tecniche, ad esempio Philip I Good (2010) Test di permutazione, parametri e Bootstrap di ipotesi La mia domanda è: …
Stavo cercando di adattare i miei dati a vari modelli e ho capito che la fitdistrfunzione della libreria MASSdi Rmi dà Negative Binomialla soluzione migliore. Ora dalla pagina wiki , la definizione è data come: La distribuzione NegBin (r, p) descrive la probabilità di k fallimenti e r successi nelle …
Ho usato il pacchetto caret in R per costruire modelli predittivi per la classificazione e la regressione. Caret fornisce un'interfaccia unificata per mettere a punto gli iperparametri del modello mediante validazione incrociata o avvio del boot. Ad esempio, se stai costruendo un semplice modello di "vicini più vicini" per la …
A pagina 223 in Un'introduzione all'apprendimento statistico , gli autori sintetizzano le differenze tra regressione della cresta e lazo. Forniscono un esempio (Figura 6.9) di quando "il lazo tende a sovraperformare la regressione della cresta in termini di distorsione, varianza e MSE". Capisco perché il lazo può essere desiderabile: si …
Sto allenando una rete neurale e la perdita di allenamento diminuisce, ma la perdita di validazione non lo fa, o diminuisce molto meno di quanto mi aspetterei, sulla base di riferimenti o esperimenti con architetture e dati molto simili. Come posso risolvere questo problema? Per quanto riguarda la domanda Cosa …
Sto leggendo " Un'introduzione all'apprendimento statistico ". Nel capitolo 2, discutono il motivo della stima di una funzione .fff 2.1.1 Perché stimare ?fff Ci sono due motivi principali per cui potremmo voler stimare f : previsione e inferenza . Ne discutiamo a turno. L'ho letto più volte, ma in parte …
Il test di Mantel è ampiamente utilizzato negli studi biologici per esaminare la correlazione tra la distribuzione spaziale degli animali (posizione nello spazio) con, ad esempio, la loro relazione genetica, il tasso di aggressività o qualche altro attributo. Molte buone riviste lo stanno utilizzando ( PNAS, comportamento animale, ecologia molecolare …
Attualmente sto usando il pacchetto R lme4 . Sto usando un modello lineare di effetti misti con effetti casuali: library(lme4) mod1 <- lmer(r1 ~ (1 | site), data = sample_set) #Only random effects mod2 <- lmer(r1 ~ p1 + (1 | site), data = sample_set) #One fixed effect + # …
Penso di avere l'idea generale di VI e MCMC, compresi i vari gusti di MCMC come il campionamento di Gibbs, Metropolis Hastings ecc. Questo documento fornisce una meravigliosa esposizione di entrambi i metodi. Ho le seguenti domande: Se desidero fare l'inferenza bayesiana, perché dovrei scegliere un metodo rispetto all'altro? Quali …
Stavo guardando una presentazione di uno specialista ML di un importante rivenditore, in cui avevano sviluppato un modello per prevedere eventi fuori stock. Supponiamo per un momento che nel tempo il loro modello diventi molto preciso, non sarebbe in qualche modo "autolesionista"? Cioè, se il modello funziona davvero bene, allora …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.