Domande taggate «regression»

Tecniche per l'analisi della relazione tra una (o più) variabili "dipendenti" e variabili "indipendenti".







3
Perché Lars e Glmnet offrono soluzioni diverse per il problema del lazo?
Voglio capire meglio i pacchetti R Larse Glmnet, che sono usati per risolvere il problema Lazo: (per Variabili e campioni, vedi www.stanford.edu/~hastie/Papers/glmnet.pdf a pagina 3)pNm i n( β0β) ∈ Rp + 1[ 12 NΣi = 1N( yio- β0- xTioβ)2+ λ | | β| |l1]mion(β0β)∈Rp+1[12NΣio=1N(yio-β0-XioTβ)2+λ||β||l1]min_{(\beta_0 \beta) \in R^{p+1}} \left[\frac{1}{2N}\sum_{i=1}^{N}(y_i-\beta_0-x_i^T\beta)^2 + \lambda||\beta …


5
Regressione polinomiale grezza o ortogonale?
Voglio regredire una variabile yyy su x,x2,…,x5x,x2,…,x5x,x^2,\ldots,x^5 . Dovrei farlo usando polinomi grezzi o ortogonali? Ho esaminato la domanda sul sito che tratta di questi, ma non capisco davvero quale sia la differenza tra il loro utilizzo. Perché non posso semplicemente fare una regressione "normale" per ottenere i coefficienti βiβi\beta_i …

1
Eliminazione di una delle colonne quando si utilizza la codifica a caldo
La mia comprensione è che nell'apprendimento automatico può essere un problema se il tuo set di dati ha caratteristiche altamente correlate, poiché codificano effettivamente le stesse informazioni. Recentemente qualcuno ha sottolineato che quando si esegue la codifica one-hot su una variabile categoriale si finisce con funzionalità correlate, quindi è necessario …


1
Set di dati simili a Anscombe con lo stesso riquadro e trama di baffi (media / std / mediana / MAD / min / max)
EDIT: Poiché questa domanda è stata gonfiata, un riassunto: trovare diversi set di dati significativi e interpretabili con le stesse statistiche miste (media, mediana, media e le loro dispersioni associate e regressione). Il quartetto Anscombe (vedi Scopo della visualizzazione di dati ad alta dimensione? ) È un famoso esempio di …


2
Perché la normalità dei residui è "a malapena importante" ai fini della stima della linea di regressione?
Gelman and Hill (2006) scrivono a p46 che: L'ipotesi di regressione che è generalmente meno importante è che gli errori siano normalmente distribuiti. In effetti, allo scopo di stimare la linea di regressione (rispetto alla previsione dei singoli punti dati), l'assunzione della normalità è a malapena importante. Pertanto, contrariamente a …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.