Domande taggate «multicollinearity»

Situazione in cui esiste una forte relazione lineare tra le variabili predittive, in modo che la loro matrice di correlazione diventi (quasi) singolare. Questa "malattia" rende difficile determinare il ruolo unico di ciascuno dei predittori: sorgono problemi di stima e aumentano gli errori standard. I predittori bivaramente molto correlati sono un esempio di multicollinearità.

2
La codifica variabile qualitativa nella regressione porta a "singolarità"
Ho una variabile indipendente chiamata "qualità"; questa variabile ha 3 modalità di risposta (cattiva qualità; media qualità; alta qualità). Voglio introdurre questa variabile indipendente nella mia regressione lineare multipla. Quando ho una variabile binaria indipendente (variabile fittizia, posso codificare 0/ 1) è facile introdurla in un modello di regressione lineare …


1
Regressione logistica - Preoccupazioni / insidie ​​della multicinearità
Nella regressione logistica, c'è bisogno di preoccuparsi tanto della multicollinearità quanto della regressione OLS diretta? Ad esempio, con una regressione logistica, laddove esiste la multicollinearità, dovresti essere prudente (come faresti con la regressione OLS) nel prendere l'inferenza dai coefficienti Beta? Per la regressione OLS una "correzione" per l'alta multicollinearità è …

3
Quando possiamo parlare di collinearità
Nei modelli lineari dobbiamo verificare se esiste una relazione tra le variabili esplicative. Se si correlano troppo, allora c'è collinearità (cioè le variabili si spiegano in parte a vicenda). Attualmente sto solo esaminando la correlazione a coppie tra ciascuna delle variabili esplicative. Domanda 1: Cosa classifica come troppa correlazione? Ad …

1
Perché questa regressione NON fallisce a causa della perfetta multicollinearità, sebbene una variabile sia una combinazione lineare di altre?
Oggi stavo giocando con un piccolo set di dati e ho eseguito una semplice regressione OLS che mi aspettavo di fallire a causa della perfetta multicollinearità. Tuttavia, non lo fece. Ciò implica che la mia comprensione della multicollinearità è errata. La mia domanda è: dove sbaglio? Penso di poter dimostrare …

1
Qual è l'intuizione dietro i campioni scambiabili sotto l'ipotesi nulla?
I test di permutazione (chiamati anche test di randomizzazione, test di ri-randomizzazione o test esatto) sono molto utili e sono utili quando l'assunzione della distribuzione normale richiesta da per esempio t-testnon è soddisfatta e quando la trasformazione dei valori per classifica del test non parametrici come Mann-Whitney-U-testquesto porterebbero alla perdita …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 



4
Bisogna preoccuparsi della multi-collinearità quando si usano modelli non lineari?
Supponiamo che abbiamo un problema di classificazione binaria con caratteristiche per lo più categoriche. Usiamo alcuni modelli non lineari (ad esempio XGBoost o Random Forests) per impararlo. Bisogna ancora preoccuparsi della multi-collinearità? Perché? Se la risposta a quanto sopra è vera, come si dovrebbe combatterla considerando che si stanno usando …

2
Regressione lineare quando si conosce solo
Supponiamo Xβ=YXβ=YX\beta =Y . Non sappiamo YYY esattamente, solo la sua correlazione con ogni predittore, XtYXtYX^\mathrm{t}Y . La soluzione ordinaria dei minimi quadrati (OLS) è β=(XtX)−1XtYβ=(XtX)−1XtY\beta=(X^\mathrm{t} X)^{-1} X^\mathrm{t}Y e non c'è nessun problema. Supponiamo però che XtXXtXX^\mathrm{t}X sia quasi singolare (multicollinearità) e che sia necessario stimare il parametro cresta ottimale. …

2
Cosa sono i chunk test?
In risposta a una domanda sulla selezione del modello in presenza di multicollinearità , Frank Harrell ha suggerito : Inserisci tutte le variabili nel modello ma non testare l'effetto di una variabile aggiustata per gli effetti delle variabili concorrenti ... I test di blocco delle variabili concorrenti sono potenti perché …



3
Come è possibile gestire stime instabili nella regressione lineare con elevata multi-collinearità senza eliminare le variabili?
Stabilità beta nella regressione lineare con elevata multi-collinearità? Diciamo in una regressione lineare, le variabili e hanno un'elevata multi-collinearità (la correlazione è intorno allo 0,9).x 2x1x1x_1x2x2x_2 Siamo preoccupati per la stabilità del coefficiente , quindi dobbiamo trattare la multi-collinearità.ββ\beta La soluzione per i libri di testo sarebbe semplicemente eliminare una …

2
Trattare con multicollinearità
Ho imparato che usando il vif()metodo del carpacchetto, possiamo calcolare il grado di multicollinearità degli input in un modello. Da Wikipedia , se il vifvalore è maggiore di 5allora possiamo considerare che l'input soffre di problemi di multicollinearità. Ad esempio, ho sviluppato un modello di regressione lineare usando il lm()metodo …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.