Usa questo tag per qualsiasi domanda * sull'argomento * che (a) coinvolga `R` come parte critica della domanda o risposta prevista, e (b) non è * solo * su come usare` R`.
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 3 anni fa . Sto costruendo una regressione logistica in R usando il metodo LASSO con le funzioni cv.glmnetper selezionare il …
Ho un set di dati in cui la variabile che vorrei usare come effetto casuale ha una sola osservazione per alcuni livelli. Sulla base delle risposte alle domande precedenti, ho raccolto che, in linea di principio, questo può andare bene. Posso adattare un modello misto a soggetti che hanno solo …
Supponiamo di definire: X∼Beta(α,β)X∼Beta(α,β)X\sim\mbox{Beta}(\alpha,\beta) Y∼Φ−1(X)Y∼Φ−1(X)Y\sim \Phi^{-1}(X) dove Φ−1Φ−1\Phi^{-1} è l'inverso del CDF della distribuzione normale standard . La mia domanda è: esiste una semplice distribuzione che segue YYY o che può approssimare YYY ? Sto chiedendo perché ho un forte sospetto basato sui risultati della simulazione (mostrati sotto) che YYY …
Sono un po 'confuso: in che modo i risultati di un modello addestrato tramite il cursore possono differire dal modello nella confezione originale? Ho letto Se è necessaria la preelaborazione prima della previsione utilizzando FinalModel di RandomForest con pacchetto di inserimento? ma non uso alcuna preelaborazione qui. Ho addestrato diverse …
Ho corso una regressione lineare dell'accettazione al college contro i punteggi SAT e la famiglia / origine etnica. I dati sono fittizi. Questo è il seguito di una domanda precedente, a cui è già stata data una risposta. La domanda si concentra sulla raccolta e l'interpretazione dei rapporti di probabilità …
Sto cercando un metodo per calcolare l'area di sovrapposizione tra due stime della densità del kernel in R, come misura della somiglianza tra due campioni. Per chiarire, nel seguente esempio, avrei bisogno di quantificare l'area della regione di sovrapposizione violacea: library(ggplot2) set.seed(1234) d <- data.frame(variable=c(rep("a", 50), rep("b", 30)), value=c(rnorm(50), runif(30, …
Attualmente sto esaminando alcuni lavori e ho riscontrato quanto segue, il che mi sembra sbagliato. Due modelli misti sono montati (in R) usando lmer. I modelli non sono nidificati e vengono confrontati mediante test del rapporto di verosimiglianza. In breve, ecco un esempio riproducibile di ciò che ho: set.seed(105) Resp …
Sto addestrando un modello di classificazione con Random Forest per discriminare tra 6 categorie. I miei dati transazionali hanno circa 60k + osservazioni e 35 variabili. Ecco un esempio di come appare approssimativamente. _________________________________________________ |user_id|acquisition_date|x_var_1|x_var_2| y_vay | |-------|----------------|-------|-------|--------| |111 | 2013-04-01 | 12 | US | group1 | |222 | …
Ho un campione di 100 punti che sono continui e monodimensionali. Ho stimato la sua densità non parametrica usando i metodi del kernel. Come posso estrarre campioni casuali da questa distribuzione stimata?
So che potrebbe essere un po 'complicato, statisticamente, ma questo è il mio problema. Ho molti dati di intervallo, vale a dire la dimensione minima, massima e di campionamento di una variabile. Per alcuni di questi dati ho anche una media, ma non molti. Voglio confrontare questi intervalli tra loro …
Sto cercando di capire il risultato che vedo nel mio grafico qui sotto. Di solito, tendo a usare Excel e ottengo una linea di regressione lineare, ma nel caso seguente sto usando R e ottengo una regressione polinomiale con il comando: ggplot(visual1, aes(ISSUE_DATE,COUNTED)) + geom_point() + geom_smooth() Quindi le mie …
Versione breve: sto cercando un pacchetto R in grado di costruire alberi decisionali mentre ogni foglia dell'albero decisionale è un modello di regressione lineare completo. AFAIK, la libreria rpartcrea alberi decisionali in cui la variabile dipendente è costante in ogni foglia. Esiste un'altra libreria (o rpartun'impostazione di cui non sono …
Sorprendentemente, non sono stato in grado di trovare una risposta alla seguente domanda utilizzando Google: Ho alcuni dati biologici di diversi individui che mostrano un comportamento di crescita approssimativamente sigmoideo nel tempo. Pertanto, desidero modellarlo utilizzando una crescita logistica standard P(t) = k*p0*exp(r*t) / (k+p0*(exp(r*t)-1)) con p0 come valore iniziale …
Questo è un seguito ma anche una domanda diversa dalla mia precedente . Ho letto su Wikipedia che " Uno stimatore imparziale mediano minimizza il rischio rispetto alla funzione di perdita di deviazione assoluta, come osservato da Laplace ". Tuttavia, i risultati della mia simulazione Monte Carlo non supportano questo …
Ho un set di dati di misure ripetute sbilanciate da analizzare e ho letto che il modo in cui la maggior parte dei pacchetti statistici gestisce questo con ANOVA (ovvero la somma dei quadrati di tipo III) è sbagliato. Pertanto, vorrei utilizzare un modello di effetti misti per analizzare questi …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.