Il mgcvpacchetto per Rha due funzioni per adattare le interazioni del prodotto tensore: te()e ti(). Comprendo la divisione di base del lavoro tra i due (adattamento di un'interazione non lineare rispetto alla scomposizione di questa interazione in effetti principali e un'interazione). Quello che non capisco è perché te(x1, x2)e ti(x1) …
Qual è la differenza statistica tra fare una regressione lineare in R con il formulaset su y ~ x + 0invece di y ~ x? Come posso interpretare questi due diversi risultati?
Sto eseguendo la regressione lineare multipla di seguito in R per prevedere i rendimenti sui fondi gestiti. reg <- lm(formula=RET~GRI+SAT+MBA+AGE+TEN, data=rawdata) Qui solo GRI e MBA sono predittori binari / dicotomici; i predittori rimanenti sono continui. Sto usando questo codice per generare grafici residui per le variabili binarie. plot(rawdata$GRI, reg$residuals) …
Sto osservando strani schemi nei residui per i miei dati: [EDIT] Ecco i grafici di regressione parziale per le due variabili: [EDIT2] Aggiunto il grafico PP La distribuzione sembra andare bene (vedi sotto) ma non ho idea di da dove possa venire questa retta. Qualche idea? [AGGIORNAMENTO 31.07] Si scopre …
Perché uno dovrebbe usare l'età e il quadrato come covariate in uno studio di associazione genetica? Riesco a capire l'uso dell'età se è stato identificato come una covariata significativa, ma sono perplesso riguardo all'uso dell'età al quadrato.
Sono consapevole del fatto che le variabili categoriali con livelli k dovrebbero essere codificate con variabili k-1 nella codifica fittizia (analogamente per le variabili categoriali multivalore). Mi chiedevo quanto fosse un problema una codifica one-hot (ovvero usando invece le variabili k) rispetto alla codifica fittizia per diversi metodi di regressione, …
Non ho in mente un esempio o un compito specifico. Sono appena nuovo sull'uso di b-splines e volevo capire meglio questa funzione nel contesto della regressione. Supponiamo di voler valutare la relazione tra la variabile di risposta e alcuni predittori . I predittori includono alcune variabili numeriche e anche alcune …
Considera il seguente modello di regressione multipla:Y=Xβ+Zδ+U.(1)(1)Y=Xβ+Zδ+U.Y=X\beta+Z\delta+U.\tag{1} Qui YYY è un vettore di colonna n×1n×1n\times 1 ; Matrice XXX a n×(k+1)n×(k+1)n\times (k+1) ; ββ\beta a (k+1)×1(k+1)×1(k+1)\times 1 colonna vettore; ZZZ a n×ln×ln\times l matrice; δδ\delta a l×1l×1l\times 1 colonna vettore; e UUU , il termine di errore, un vettore di …
Di seguito è riportato un nomogramma creato dal set di dati mtcars con pacchetto rms per la formula: mpg ~ wt + am + qsec Il modello stesso sembra buono con R2 di 0,85 e P <0,00001 > mod Linear Regression Model ols(formula = mpg ~ wt + am + …
Sto eseguendo una regressione OLS in pool usando il pacchetto plm in R. Tuttavia, la mia domanda è più sulle statistiche di base, quindi provo a postarla qui prima;) Poiché i risultati della mia regressione producono residui eteroschedastici, vorrei provare a utilizzare errori standard robusti per l'eteroschedasticità. Come risultato coeftest(mod, …
Stavo leggendo il capitolo di regressione multipla di Analisi dei dati e grafica usando R: un approccio basato su esempi ed ero un po 'confuso nello scoprire che raccomandava di controllare le relazioni lineari tra le variabili esplicative (usando un diagramma a dispersione) e, nel caso in cui non ci …
Supponiamo che corrisponda a una regressione multipla di p variabili esplicative. Il test t mi permetterà di verificare se uno di questi è significativo ( ). Posso fare un F-test parziale per verificare se alcuni sottoinsiemi di essi sono significativi ( ).H 0 : β i = β j = …
Ho un GLMM del modulo: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), ottengo risultati diversi rispetto a quelli che utilizzo Anova(model, type="III")dal pacchetto auto o summary(model). Questi ultimi due danno le stesse risposte. Usando un mucchio di dati fabbricati, …
Ho una domanda sull'approccio delle differenze nelle differenze con la seguente equazione standard: dove trattare è una variabile dummy per il gruppo trattato e post. y= a + b1trattare + b2posta + b3tratta ⋅ post + uy=a+b1treat+b2post+b3treat⋅post+u y= a + b_1\text{treat}+ b_2\text{post} + b_3\text{treat}\cdot\text{post} + u Ora, la mia domanda …
Nella cornice della regressione multipla multivariata (regressore vettoriale e regressore), i quattro test principali per l'ipotesi generale (Wilk's Lambda, Pillai-Bartlett, Hotelling-Lawley e Roy's Largest Root) dipendono tutti dagli autovalori della matrice , dove ed sono le matrici di variazione "spiegate" e "totali".HE−1HE−1H E^{-1}HHHEEE Avevo notato che le statistiche di Pillai …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.