Statistiche e Big Data r

1

La regressione logistica di glmnet può gestire direttamente le variabili fattoriali (categoriche) senza la necessità di variabili fittizie? [chiuso]

Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 3 anni fa . Sto costruendo una regressione logistica in R usando il metodo LASSO con le funzioni cv.glmnetper selezionare il …

15 r logistic categorical-data lasso glmnet

1

In che modo gli effetti casuali con 1 sola osservazione influenzeranno un modello misto lineare generalizzato?

Ho un set di dati in cui la variabile che vorrei usare come effetto casuale ha una sola osservazione per alcuni livelli. Sulla base delle risposte alle domande precedenti, ho raccolto che, in linea di principio, questo può andare bene. Posso adattare un modello misto a soggetti che hanno solo …

14 r mixed-model generalized-linear-model glmm lme4-nlme

3

Quale distribuzione segue il CDF normale inverso di una variabile casuale beta?

Supponiamo di definire: X∼Beta(α,β)X∼Beta(α,β)X\sim\mbox{Beta}(\alpha,\beta) Y∼Φ−1(X)Y∼Φ−1(X)Y\sim \Phi^{-1}(X) dove Φ−1Φ−1\Phi^{-1} è l'inverso del CDF della distribuzione normale standard . La mia domanda è: esiste una semplice distribuzione che segue YYY o che può approssimare YYY ? Sto chiedendo perché ho un forte sospetto basato sui risultati della simulazione (mostrati sotto) che YYY …

14 r normal-distribution mathematical-statistics beta-distribution

2

Risultati diversi da randomForest via caret e dal pacchetto randomForest di base

Sono un po 'confuso: in che modo i risultati di un modello addestrato tramite il cursore possono differire dal modello nella confezione originale? Ho letto Se è necessaria la preelaborazione prima della previsione utilizzando FinalModel di RandomForest con pacchetto di inserimento? ma non uso alcuna preelaborazione qui. Ho addestrato diverse …

14 r machine-learning random-forest caret train

1

Da exp (coefficienti) a Odds Ratio e la loro interpretazione nella regressione logistica con fattori

Ho corso una regressione lineare dell'accettazione al college contro i punteggi SAT e la famiglia / origine etnica. I dati sono fittizi. Questo è il seguito di una domanda precedente, a cui è già stata data una risposta. La domanda si concentra sulla raccolta e l'interpretazione dei rapporti di probabilità …

14 r regression logistic

3

Come calcolare la sovrapposizione tra densità di probabilità empiriche?

Sto cercando un metodo per calcolare l'area di sovrapposizione tra due stime della densità del kernel in R, come misura della somiglianza tra due campioni. Per chiarire, nel seguente esempio, avrei bisogno di quantificare l'area della regione di sovrapposizione violacea: library(ggplot2) set.seed(1234) d <- data.frame(variable=c(rep("a", 50), rep("b", 30)), value=c(rnorm(50), runif(30, …

14 r probability pdf kernel-smoothing

1

Test del rapporto di verosimiglianza - lmer R - Modelli non nidificati

Attualmente sto esaminando alcuni lavori e ho riscontrato quanto segue, il che mi sembra sbagliato. Due modelli misti sono montati (in R) usando lmer. I modelli non sono nidificati e vengono confrontati mediante test del rapporto di verosimiglianza. In breve, ecco un esempio riproducibile di ciò che ho: set.seed(105) Resp …

14 r lme4-nlme likelihood-ratio nested-models

3

Ponderazione dei dati più recenti nel modello Foresta casuale

Sto addestrando un modello di classificazione con Random Forest per discriminare tra 6 categorie. I miei dati transazionali hanno circa 60k + osservazioni e 35 variabili. Ecco un esempio di come appare approssimativamente. _________________________________________________ |user_id|acquisition_date|x_var_1|x_var_2| y_vay | |-------|----------------|-------|-------|--------| |111 | 2013-04-01 | 12 | US | group1 | |222 | …

14 r machine-learning classification random-forest

1

Come prelevare campioni casuali da una distribuzione stimata non parametrica?

Ho un campione di 100 punti che sono continui e monodimensionali. Ho stimato la sua densità non parametrica usando i metodi del kernel. Come posso estrarre campioni casuali da questa distribuzione stimata?

14 r sampling kernel-smoothing

3

Posso ricostruire una distribuzione normale dalla dimensione del campione e dai valori minimo e massimo? Posso usare il punto intermedio per delineare la media

So che potrebbe essere un po 'complicato, statisticamente, ma questo è il mio problema. Ho molti dati di intervallo, vale a dire la dimensione minima, massima e di campionamento di una variabile. Per alcuni di questi dati ho anche una media, ma non molti. Voglio confrontare questi intervalli tra loro …

14 r normal-distribution estimation missing-data order-statistics

3

Comprensione della banda di confidenza da una regressione polinomiale

Sto cercando di capire il risultato che vedo nel mio grafico qui sotto. Di solito, tendo a usare Excel e ottengo una linea di regressione lineare, ma nel caso seguente sto usando R e ottengo una regressione polinomiale con il comando: ggplot(visual1, aes(ISSUE_DATE,COUNTED)) + geom_point() + geom_smooth() Quindi le mie …

14 r regression data-visualization outliers

3

Algoritmo dell'albero di regressione con modelli di regressione lineare in ogni foglia

Versione breve: sto cercando un pacchetto R in grado di costruire alberi decisionali mentre ogni foglia dell'albero decisionale è un modello di regressione lineare completo. AFAIK, la libreria rpartcrea alberi decisionali in cui la variabile dipendente è costante in ogni foglia. Esiste un'altra libreria (o rpartun'impostazione di cui non sono …

14 r regression rpart cart

1

Regressione non lineare di effetti misti in R

Sorprendentemente, non sono stato in grado di trovare una risposta alla seguente domanda utilizzando Google: Ho alcuni dati biologici di diversi individui che mostrano un comportamento di crescita approssimativamente sigmoideo nel tempo. Pertanto, desidero modellarlo utilizzando una crescita logistica standard P(t) = k*p0*exp(r*t) / (k+p0*(exp(r*t)-1)) con p0 come valore iniziale …

14 r nonlinear-regression mixed-model growth-model

1

Uno stimatore imparziale mediano minimizza la devianza assoluta?

Questo è un seguito ma anche una domanda diversa dalla mia precedente . Ho letto su Wikipedia che " Uno stimatore imparziale mediano minimizza il rischio rispetto alla funzione di perdita di deviazione assoluta, come osservato da Laplace ". Tuttavia, i risultati della mia simulazione Monte Carlo non supportano questo …

14 r unbiased-estimator median lognormal mad

1

È un modo accettabile per analizzare i modelli di effetti misti con lme4 in R?

Ho un set di dati di misure ripetute sbilanciate da analizzare e ho letto che il modo in cui la maggior parte dei pacchetti statistici gestisce questo con ANOVA (ovvero la somma dei quadrati di tipo III) è sbagliato. Pertanto, vorrei utilizzare un modello di effetti misti per analizzare questi …

14 r mixed-model lme4-nlme

Domande taggate «r»