Stavo cercando di adattare i dati di una serie storica (senza repliche) utilizzando il modello di regressione. I dati si presentano come segue: > xx.2 value time treat 1 8.788269 1 0 2 7.964719 6 0 3 8.204051 12 0 4 9.041368 24 0 5 8.181555 48 0 6 8.041419 …
(AGGIORNAMENTO: mi sono approfondito e ho pubblicato i risultati qui ) L'elenco dei test statistici nominati è enorme. Molti dei test comuni si basano sull'inferenza da semplici modelli lineari, ad esempio un test t di un campione è solo y = β + ε che viene testato rispetto al modello …
Per illustrare la mia domanda, supponiamo che io abbia un set di addestramento in cui l'input ha un certo livello di rumore ma l'output no, per esempio; # Training data [1.02, 1.95, 2.01, 3.06] : [1.0] [2.03, 4.11, 5.92, 8.00] : [2.0] [10.01, 11.02, 11.96, 12.04] : [1.0] [2.99, 6.06, …
La prima frase di questa pagina wiki afferma che "In econometria, si verifica un problema di endogeneità quando una variabile esplicativa è correlata al termine di errore. 1 " La mia domanda è che come può mai accadere? La regressione beta non è scelta in modo tale che il termine …
Andrew Gelman in uno dei suoi recenti post sul blog dice: Non credo siano necessari controfattuali o potenziali esiti per il paradosso di Simpson. Dico questo perché si può impostare il paradosso di Simpson con variabili che non possono essere manipolate o per le quali le manipolazioni non sono direttamente …
Comprendo che il test Wald per i coefficienti di regressione si basa sulla seguente proprietà che detiene asintoticamente (ad esempio Wasserman (2006): All of Statistics , pagine 153, 214-215): Dove indica il coefficiente di regressione stimato, indica l'errore standard del coefficiente di regressione e è il valore di interesse ( …
Voglio capire meglio i pacchetti R Larse Glmnet, che sono usati per risolvere il problema Lazo: (per Variabili e campioni, vedi www.stanford.edu/~hastie/Papers/glmnet.pdf a pagina 3)pNm i n( β0β) ∈ Rp + 1[ 12 NΣi = 1N( yio- β0- xTioβ)2+ λ | | β| |l1]mion(β0β)∈Rp+1[12NΣio=1N(yio-β0-XioTβ)2+λ||β||l1]min_{(\beta_0 \beta) \in R^{p+1}} \left[\frac{1}{2N}\sum_{i=1}^{N}(y_i-\beta_0-x_i^T\beta)^2 + \lambda||\beta …
Ci sono state buone domande sulla gestione dei dati squilibrati nel contesto della classificazione , ma mi chiedo cosa facciano le persone per campionare per la regressione. Supponiamo che il dominio problematico sia molto sensibile al segno ma solo in qualche modo sensibile alla grandezza del bersaglio. Tuttavia la grandezza …
Voglio regredire una variabile yyy su x,x2,…,x5x,x2,…,x5x,x^2,\ldots,x^5 . Dovrei farlo usando polinomi grezzi o ortogonali? Ho esaminato la domanda sul sito che tratta di questi, ma non capisco davvero quale sia la differenza tra il loro utilizzo. Perché non posso semplicemente fare una regressione "normale" per ottenere i coefficienti βiβi\beta_i …
La mia comprensione è che nell'apprendimento automatico può essere un problema se il tuo set di dati ha caratteristiche altamente correlate, poiché codificano effettivamente le stesse informazioni. Recentemente qualcuno ha sottolineato che quando si esegue la codifica one-hot su una variabile categoriale si finisce con funzionalità correlate, quindi è necessario …
La mia domanda è nata da una discussione con @whuber nei commenti di un'altra domanda . Nello specifico, il commento di @whuber è stato il seguente: Uno dei motivi per cui potrebbe sorprenderti è che le ipotesi alla base di un test di correlazione e di un test di pendenza …
EDIT: Poiché questa domanda è stata gonfiata, un riassunto: trovare diversi set di dati significativi e interpretabili con le stesse statistiche miste (media, mediana, media e le loro dispersioni associate e regressione). Il quartetto Anscombe (vedi Scopo della visualizzazione di dati ad alta dimensione? ) È un famoso esempio di …
Voglio modellare una regressione logistica con dati sbilanciati (9: 1). Volevo provare l'opzione pesi nella glmfunzione in R, ma non sono sicuro al 100% di ciò che fa. Diciamo che la mia variabile di output è c(0,0,0,0,0,0,0,0,0,1). ora voglio dare l '"1" 10 volte più peso. quindi do l'argomento pesi …
Gelman and Hill (2006) scrivono a p46 che: L'ipotesi di regressione che è generalmente meno importante è che gli errori siano normalmente distribuiti. In effetti, allo scopo di stimare la linea di regressione (rispetto alla previsione dei singoli punti dati), l'assunzione della normalità è a malapena importante. Pertanto, contrariamente a …
Qual è la differenza tra regressione logistica e logit? Capisco che sono simili (o anche la stessa cosa) ma qualcuno potrebbe spiegare la differenza (s) tra questi due? Si tratta di probabilità?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.