Domande taggate «regression»

Tecniche per l'analisi della relazione tra una (o più) variabili "dipendenti" e variabili "indipendenti".

3
Una regressione lineare può essere significativa se i dati non sono lineari?
Ho eseguito una regressione lineare che ha prodotto un risultato significativo, tuttavia quando ho verificato la linearità del diagramma a dispersione non ero sicuro che i dati fossero lineari. Esistono altri modi per verificare la linearità senza ispezionare il diagramma a dispersione? La regressione lineare potrebbe essere significativa se non …
11 regression 





4
Perché i metodi di regressione Least-Squares e Maximum-Likelihood non sono equivalenti quando gli errori non sono normalmente distribuiti?
Il titolo dice tutto. Comprendo che i minimi quadrati e la massima verosimiglianza daranno lo stesso risultato per i coefficienti di regressione se gli errori del modello sono normalmente distribuiti. Ma cosa succede se gli errori non vengono normalmente distribuiti? Perché i due metodi non sono più equivalenti?


2
La suddivisione dei dati in set di test e training è puramente una cosa "statistica"?
Sono uno studente di fisica che studia apprendimento automatico / scienza dei dati, quindi non intendo per questa domanda iniziare alcun conflitto :) Tuttavia, gran parte di qualsiasi programma di laurea in fisica è fare laboratori / esperimenti, il che significa molti dati elaborazione e analisi statistica. Tuttavia, noto una …

1
Come interpretare i risultati quando sia la cresta che il lazo funzionano separatamente ma producono coefficienti diversi
Sto eseguendo un modello di regressione sia con Lasso che con Ridge (per prevedere una variabile di esito discreto che varia da 0-5). Prima di eseguire il modello, utilizzo il SelectKBestmetodo di scikit-learnper ridurre il set di funzionalità da 250 a 25 . Senza una selezione iniziale delle caratteristiche, sia …


2
Se il restringimento viene applicato in modo intelligente, funziona sempre meglio per stimatori più efficienti?
Supponiamo di avere due stimatori e che sono stimatori coerenti dello stesso parametro e tali che con in senso psd. Pertanto, asintoticamente è più efficiente di . Questi due stimatori si basano su diverse funzioni di perdita. β 2β0√βˆ1β^1\widehat{\beta}_1βˆ2β^2\widehat{\beta}_2β0β0\beta_0n−−√(βˆ1−β0)→dN(0,V1),n−−√(βˆ2−β0)→dN(0,V2)n(β^1−β0)→dN(0,V1),n(β^2−β0)→dN(0,V2)\sqrt{n}(\widehat{\beta}_1 -\beta_0) \stackrel{d}\rightarrow \mathcal{N}(0, V_1), \quad \sqrt{n}(\widehat{\beta}_2 -\beta_0) \stackrel{d}\rightarrow \mathcal{N}(0, V_2) β …

3
Regressione con dati distorti
Cercare di calcolare i conteggi delle visite in base a dati demografici e servizi. I dati sono molto distorti. Gli istogrammi: grafici qq (a sinistra è il registro): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) citye servicesono variabili fattoriali. Ottengo un valore p basso *** per tutte le variabili, ma ottengo …




Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.