Domande taggate «regression»

Tecniche per l'analisi della relazione tra una (o più) variabili "dipendenti" e variabili "indipendenti".

4
Interpretazione pseudo-R2 di McFadden
Ho un modello di regressione logistica binaria con uno pseudo R-quadrato di McFadden di 0,192 con una variabile dipendente chiamata payment (1 = pagamento e 0 = nessun pagamento). Qual è l'interpretazione di questo pseudo R-quadrato? È un confronto relativo per i modelli nidificati (ad esempio un modello a 6 …




3



1
Perché la mia derivazione di una soluzione lazo in forma chiusa non è corretta?
βlasso=argminβ∥y−Xβ∥22+α∥β∥1βlasso=argminβ⁡‖y−Xβ‖22+α‖β‖1\beta^{\text{lasso}}= \operatorname*{argmin}_\beta \| y-X\beta\|^2_2 + \alpha \| \beta\|_1βlassoj=sgn(βLSj)(|βLSj|−α)+βjlasso=sgn(βjLS)(|βjLS|−α)+ \beta_j^{\text{lasso}}= \mathrm{sgn}(\beta^{\text{LS}}_j)(|\beta_j^{\text{LS}}|-\alpha)^+ XXX Tuttavia non capisco perché non esiste una soluzione a forma chiusa in generale. Usando le sottodifferenziali ho ottenuto quanto segue. ( XXX è una matrice n×pn×pn \times p ) f(β)=∥y−Xβ∥22+α∥β∥1f(β)=‖y−Xβ‖22+α‖β‖1f(\beta)=\|{y-X\beta}\|_2^2 + \alpha\|{\beta}\|_1 =∑i=1n(yi−Xiβ)2+α∑j=1p|βj|=∑i=1n(yi−Xiβ)2+α∑j=1p|βj| =\sum_{i=1}^n (y_i-X_i\beta)^2 + \alpha \sum_{j=1}^p |\beta_j| …

5
Quali sono i pericoli derivanti dalla violazione dell'ipotesi di omoscedasticità per la regressione lineare?
Ad esempio, considera il ChickWeightset di dati in R. La varianza ovviamente aumenta nel tempo, quindi se uso una semplice regressione lineare come: m <- lm(weight ~ Time*Diet, data=ChickWeight) Le mie domande: Quali aspetti del modello saranno discutibili? I problemi si limitano all'estrapolazione al di fuori Timedell'intervallo? Quanto è tollerante …

1
Ripetibilità informatica degli effetti da un modello più leggero
Mi sono appena imbattuto in questo documento , che descrive come calcolare la ripetibilità ( nota anche come affidabilità, nota anche come correlazione intraclasse) di una misurazione tramite la modellazione di effetti misti. Il codice R sarebbe: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 



6
Perché abbiamo bisogno della regressione multivariata (al contrario di un mucchio di regressioni univariate)?
Ho appena sfogliato questo meraviglioso libro: analisi statistica multivariata applicata di Johnson e Wichern . L'ironia è che non sono ancora in grado di comprendere la motivazione per l'utilizzo di modelli multivariati (regressione) invece di modelli univariati separati (regressione). Ho esaminato i post 1 e 2 di stats.statexchange che spiegano …

3
Perché la centratura di variabili indipendenti può modificare gli effetti principali con moderazione?
Ho una domanda relativa alla regressione multipla e all'interazione, ispirata a questo thread CV: termine di interazione che utilizza l'analisi della regressione gerarchica con variabili centrate? Quali variabili dovremmo centrare? Quando cerco un effetto di moderazione, concentro le mie variabili indipendenti e moltiplico le variabili centrate per calcolare il mio …

2
Perché RSS distribuito chi square times np?
Vorrei capire perché, sotto il modello OLS, l'RSS (somma residua dei quadrati) è distribuito ( è il numero di parametri nel modello, il numero di osservazioni).p nχ2⋅(n−p)χ2⋅(n−p)\chi^2\cdot (n-p)pppnnn Mi scuso per aver posto una domanda così basilare, ma sembra che non riesca a trovare la risposta online (o nei miei …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.