Questa domanda nasce dalla mia attuale confusione su come decidere se un modello logistico è abbastanza buono. Ho modelli che usano lo stato delle coppie progetto individuale due anni dopo che si sono formati come una variabile dipendente. Il risultato ha esito positivo (1) o meno (0). Ho variabili indipendenti …
Ne ho discusso con diversi membri del laboratorio su questo, e siamo andati a diverse fonti, ma ancora non ho la risposta: Quando diciamo che un GLM ha una famiglia di poisson , diciamo che stiamo parlando della distribuzione dei residui o della variabile di risposta? Punti di contesa Leggendo …
Ho usato il tuning del modello caret, ma poi rieseguendo il modello usando il gbmpacchetto. Comprendo che il caretpacchetto utilizza gbme l'output dovrebbe essere lo stesso. Tuttavia, solo un rapido test eseguito utilizzando data(iris)mostra una discrepanza nel modello di circa il 5% utilizzando RMSE e R ^ 2 come metrica …
Quando si modella la serie temporale si ha la possibilità di (1) modellare la struttura correlazionale dei termini di errore, ad esempio un processo AR (1) (2) include la variabile dipendente ritardata come variabile esplicativa (sul lato destro) Capisco che a volte ci sono ragioni sostanziali per cui andare (2). …
Qui viene discussa l'interpretazione errata dell'assunzione della normalità nella regressione lineare (che la "normalità" si riferisce alla X e / o Y anziché ai residui) e il poster chiede se è possibile avere X e Y non distribuiti normalmente e hanno ancora residui normalmente distribuiti. La mia domanda è: normalmente …
Ho un set di dati molto grande e mancano circa il 5% di valori casuali. Queste variabili sono correlate tra loro. Il seguente set di dati R è solo un esempio di giocattolo con dati correlati fittizi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), …
Perché è necessario porre l'assunto distributivo sugli errori, ad es ϵ i ∼ N ( 0 , σ 2 )yio= Xβ+ ϵioyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , con .εio∼ N( 0 , σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) Perché non scrivere y i ~ N ( X β , σ 2 )yio= Xβ+ …
Sono un dottorando in psicologia sperimentale e faccio del mio meglio per migliorare le mie capacità e conoscenze su come analizzare i miei dati. Fino al mio quinto anno di psicologia, ho pensato che i modelli simili alla regressione (ad es. ANOVA) assumessero le seguenti cose: normalità dei dati omogeneità …
Sto eseguendo un modello lineare generalizzato, in cui devo specificare una famiglia diversa da quella normale. Qual è la distribuzione prevista di residui? Ad esempio, i residui dovrebbero essere distribuiti normalmente?
Questa domanda è un po 'generica e prolissa, ma per favore abbi pazienza. Nella mia applicazione, ho molti set di dati, ciascuno composto da ~ 20.000 punti dati con ~ 50 funzionalità e una singola variabile binaria dipendente. Sto tentando di modellare i set di dati utilizzando la regressione logistica …
Volevo capire meglio il test esatto del pescatore, quindi ho escogitato il seguente esempio di giocattolo, dove f e m corrispondono a maschio e femmina e n e y corrispondono a "consumo di soda" in questo modo: > soda_gender f m n 0 5 y 5 0 Ovviamente, questa è …
Ho una regressione lineare che è abbastanza buona, immagino (è per un progetto universitario, quindi non devo essere molto preciso). Il punto è che se tracciamo i residui rispetto ai valori previsti, c'è (secondo il mio insegnante) un accenno di eteroschedasticità. Ma se tracciamo il diagramma QQ dei residui, è …
Quando si esegue una regressione OLS e si tracciano i residui risultanti, come si può sapere se i residui sono autocorrelati? So che ci sono test per questo (Durbin, Breusch-Godfrey), ma mi chiedevo se puoi semplicemente guardare un diagramma per valutare se l'autocorrelazione potrebbe essere un problema (perché per l'eteroschedasticità …
Sto cercando di stimare una regressione lineare multipla in R con un'equazione come questa: regr <- lm(rate ~ constant + askings + questions + 0) le domande e le domande sono serie temporali di dati trimestrali, costruite con askings <- ts(...). Il problema ora è che ho dei residui autocorrelati. …
Questo è un diagramma a mosaico del set di dati della tabella di contingenza quiHairEyeColor descritto . Come posso interpretare i colori che rappresentano i residui? Qual è la differenza tra i residui di Pearson alti e positivi (mostrati in blu) rispetto ai residui bassi e negativi mostrati in rosso?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.