Statistiche e Big Data regression

3

Una regressione lineare può essere significativa se i dati non sono lineari?

Ho eseguito una regressione lineare che ha prodotto un risultato significativo, tuttavia quando ho verificato la linearità del diagramma a dispersione non ero sicuro che i dati fossero lineari. Esistono altri modi per verificare la linearità senza ispezionare il diagramma a dispersione? La regressione lineare potrebbe essere significativa se non …

11 regression

2

Comprensione della forma dell'intervallo di confidenza per la regressione polinomiale (MLR)

Ho difficoltà a comprendere la forma dell'intervallo di confidenza di una regressione polinomiale. Ecco un esempio artificiale, . La figura a sinistra mostra l'UPV (varianza di previsione non graduata) e il grafico a destra mostra l'intervallo di confidenza e i punti (artificiali) misurati su X = 1,5, X = 2 …

11 regression confidence-interval

1

Correzioni dei gradi di libertà dovrebbero essere usate per deduzione sui parametri GLM?

Questa domanda è ispirata dalla risposta di Martijn qui . Supponiamo di adattare un GLM per una famiglia a un parametro come un modello binomiale o di Poisson e che si tratti di una procedura di piena verosimiglianza (al contrario, quasipoisson). Quindi, la varianza è una funzione della media. Con …

11 regression generalized-linear-model inference approximation t-distribution

1

Regressione lineare multivariata rispetto a diversi modelli di regressione univariata

Nelle impostazioni di regressione univariata, proviamo a modellare y= Xβ+ n o i s ey=Xβ+noisey = X\beta +noise dove un vettore di osservazioni e la matrice di progettazione con predittori. La soluzione è . n X ∈ R n × m m β 0 = ( X T X ) …

11 regression multivariate-analysis multivariate-regression

2

Perché queste tabelle di regressione anova sono identiche?

Ho due regressioni della stessa Y e tre livelli X. Complessivamente n = 15, con n = 5 in ciascun gruppo o livello di X. La prima regressione considera la X come categoriale, assegnando le variabili indicatore ai livelli 2 e 3 con livello uno è il riferimento. Gli indicatori …

11 regression anova

4

Perché i metodi di regressione Least-Squares e Maximum-Likelihood non sono equivalenti quando gli errori non sono normalmente distribuiti?

Il titolo dice tutto. Comprendo che i minimi quadrati e la massima verosimiglianza daranno lo stesso risultato per i coefficienti di regressione se gli errori del modello sono normalmente distribuiti. Ma cosa succede se gli errori non vengono normalmente distribuiti? Perché i due metodi non sono più equivalenti?

11 regression normal-distribution maximum-likelihood least-squares error

4

Reti neurali artificiali EQUIVALENTE alla regressione lineare con caratteristiche polinomiali?

Voglio migliorare la mia comprensione delle reti neurali e dei loro vantaggi rispetto ad altri algoritmi di apprendimento automatico. La mia comprensione è la seguente e la mia domanda è: Puoi correggere e integrare la mia comprensione per favore? :) La mia comprensione: (1) Reti neurali artificiali = una funzione …

11 regression machine-learning

2

La suddivisione dei dati in set di test e training è puramente una cosa "statistica"?

Sono uno studente di fisica che studia apprendimento automatico / scienza dei dati, quindi non intendo per questa domanda iniziare alcun conflitto :) Tuttavia, gran parte di qualsiasi programma di laurea in fisica è fare laboratori / esperimenti, il che significa molti dati elaborazione e analisi statistica. Tuttavia, noto una …

11 regression machine-learning cross-validation dataset experiment-design

1

Come interpretare i risultati quando sia la cresta che il lazo funzionano separatamente ma producono coefficienti diversi

Sto eseguendo un modello di regressione sia con Lasso che con Ridge (per prevedere una variabile di esito discreto che varia da 0-5). Prima di eseguire il modello, utilizzo il SelectKBestmetodo di scikit-learnper ridurre il set di funzionalità da 250 a 25 . Senza una selezione iniziale delle caratteristiche, sia …

11 regression predictive-models feature-selection lasso ridge-regression

2

Se non riesci a farlo ortogonalmente, fallo crudo (regressione polinomiale)

Quando si esegue la regressione polinomiale per su , le persone a volte usano polinomi grezzi, a volte polinomi ortogonali. Ma quando usano ciò che sembra completamente arbitrario.XYYYXXX Qui e qui vengono utilizzati polinomi grezzi. Ma qui e qui , i polinomi ortogonali sembrano dare i risultati corretti. Cosa, come, …

11 regression polynomial

2

Se il restringimento viene applicato in modo intelligente, funziona sempre meglio per stimatori più efficienti?

Supponiamo di avere due stimatori e che sono stimatori coerenti dello stesso parametro e tali che con in senso psd. Pertanto, asintoticamente è più efficiente di . Questi due stimatori si basano su diverse funzioni di perdita. β 2β0√βˆ1β^1\widehat{\beta}_1βˆ2β^2\widehat{\beta}_2β0β0\beta_0n−−√(βˆ1−β0)→dN(0,V1),n−−√(βˆ2−β0)→dN(0,V2)n(β^1−β0)→dN(0,V1),n(β^2−β0)→dN(0,V2)\sqrt{n}(\widehat{\beta}_1 -\beta_0) \stackrel{d}\rightarrow \mathcal{N}(0, V_1), \quad \sqrt{n}(\widehat{\beta}_2 -\beta_0) \stackrel{d}\rightarrow \mathcal{N}(0, V_2) β …

11 regression ridge-regression shrinkage penalized

3

Regressione con dati distorti

Cercare di calcolare i conteggi delle visite in base a dati demografici e servizi. I dati sono molto distorti. Gli istogrammi: grafici qq (a sinistra è il registro): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) citye servicesono variabili fattoriali. Ottengo un valore p basso *** per tutte le variabili, ma ottengo …

11 regression multiple-regression predictive-models exponential qq-plot

1

Quanto è differente Support Vector Regressione rispetto a SVM?

Conosco le basi di SVM e SVR, ma ancora non capisco come il problema di trovare un iperpiano che massimizzi il margine si adatti a SVR. In secondo luogo, ho letto qualcosa su usato come margine di tolleranza in SVR. Cosa significa?εε\epsilon Terzo, c'è qualche differenza tra i parametri delle …

11 regression machine-learning svm

2

Alberi decisionali e regressione - I valori previsti possono essere al di fuori dell'intervallo dei dati di allenamento?

Quando si tratta di alberi decisionali, il valore previsto può essere al di fuori dell'intervallo dei dati di addestramento? Ad esempio, se l'intervallo del set di dati di allenamento della variabile target è 0-100, quando generi il mio modello e lo applico a qualcos'altro, i miei valori possono essere -5? …

11 regression predictive-models random-forest cart

3

Risorse per l'apprendimento di tecniche multi-target?

Sto cercando risorse (libri, appunti di lezione, ecc.) Su tecniche in grado di gestire dati con target multipli (es: tre variabili dipendenti: 2 discrete e 1 continua). Qualcuno ha risorse / conoscenze su questo? So che è possibile utilizzare le reti neurali per questo.

11 regression machine-learning predictive-models references

Domande taggate «regression»