Come posso usare il valore di


13

I grafici sottostanti sono grafici a dispersione residua di un test di regressione per il quale i presupposti "normalità", "omoscedasticità" e "indipendenza" sono già stati sicuramente soddisfatti! Per testare l' assunto di "linearità" , anche se, guardando i grafici, si può intuire che la relazione è curvilinea, ma la domanda è: come si può usare il valore di "R2 Linear" per testare l'assunzione di linearità? Qual è l'intervallo accettabile per il valore di "R2 lineare" per decidere se la relazione è lineare? Cosa fare quando l'assunzione di linearità non viene soddisfatta e anche trasformare i IV non aiuta? !!

Ecco il link ai risultati completi del test.

Grafici a dispersione:

inserisci qui la descrizione dell'immagine

inserisci qui la descrizione dell'immagine

inserisci qui la descrizione dell'immagine


3
Vedo dagli sguardi dei grafici che stai usando SPSS. Basta aprire il grafico per modificare e trovare "Aggiungi pulsante linea adatta" lì troverai alcune opzioni di disegno al tratto non lineari , ad esempio Loess. Controlla se questa opzione ti dà una linea ragionevolmente retta.
ttnphns,

@ ttnphns: ho aggiunto la trama alla riga 2 di Loess alla domanda.
Ciro,

Bene, sembra piuttosto curvilineo, no? Puoi giocare di più con i parametri Loess per vedere cosa succede. Se la linea è curva, puoi concludere visivamente che la relazione non è lineare.
ttnphns,

@Cyrus, ho postato una risposta generale a questa domanda, ma aveva intenzione di aggiungere un po 'di interpretazione sulle trame e si rese conto che io non sono abbastanza sicuro che cosa la ed y assi sono in vostra trama - si può chiarire? xy
Macro,

@ ttnphns: sì, è curvilineo. Non so come trattare questo modello! In questo test (# 2) ho 2 IV che influenzano direttamente il DV (PIT). Il risultato della regressione ha mostrato che solo 1 dei IV influenza significativamente il DV. R2 è così basso (0,172) e anche la linearità è bassa (almeno, secondo il grafico, quando IV è a livelli bassi). Non so se questo test è accettabile o no! Anche io ho trasformato entrambi i IV (calcolando il loro LN) e rieseguendo la regressione, ma il risultato è peggiorato ancora!
Cyrus,

Risposte:


15

Nota che l'assunto di linearità di cui stai parlando dice solo che la media condizionale di datoYi è una funzione lineareXi. Non è possibile utilizzare il valore diper verificare questa ipotesi.R2

Questo perché è semplicemente la correlazione al quadrato tra i valori osservati e previsti eR2 il valore del coefficiente di correlazione non determina in modo univoco la relazione tra e Y (lineare o altro)XY ed entrambi i seguenti due scenari sono possibili:

  • Alto ma l'assunzione di linearità è ancora sbagliata in modo importanteR2

  • basso ma l'assunzione di linearità è ancora soddisfattaR2

Discuterò ciascuno a turno:

(1) elevato ma l'assunzione di linearità è ancora errata in modo importante:R2 il trucco qui è manipolare il fatto che la correlazione è molto sensibile agli outlier . Supponiamo di avere predittori che sono generati da una distribuzione della miscela che è normale normale al 99 % delle volte e una massa in punti a M l'altro 1 % e una variabile di risposta che èX1,...,Xn99%M1%

Yi={Ziif XiMMif Xi=M

ZiN(μ,1)Mμμ=0,M=105XiYi

u = runif(1e4)>.99
x = rnorm(1e4)
x[which(u==1)] = 1e5
y = rnorm(1e4)
y[which(x==1e5)] = 1e5
cor(x,y)
[1] 1

YiXiYiXiXi=M

R2XiYi

Yi=β0+β1Xi+εi

YiXiXivar(εi)=σ2β1R2

x = rnorm(200)
y = 1 + 2*x + rnorm(200,sd=5)
cor(x,y)^2
[1] 0.1125698

R2

Ri: Cosa fare quando l'assunzione di linearità non viene soddisfatta e anche trasformare i IV non aiuta? !!

Quando la non linearità è un problema, può essere utile esaminare i grafici dei residui rispetto a ciascun predittore: se esiste un modello evidente, ciò può indicare non linearità in quel predittore. Ad esempio, se questo diagramma rivela una relazione "a forma di scodella" tra i residui e il predittore, ciò può indicare un termine quadratico mancante in quel predittore. Altri schemi possono indicare una diversa forma funzionale. In alcuni casi, è possibile che tu non abbia provato a correggere la trasformazione o che il modello reale non sia lineare in nessuna versione trasformata delle variabili (sebbene possa essere possibile trovare un'approssimazione ragionevole).

R2


4

R2=11R2R221<x<2R2R2


Grazie Michael. La mia dimensione del campione è 302. Gradirei se potessi dare un'occhiata ai risultati del test qui e vedere se è plausibile e sostenibile riferire. TQ
Ciro,

@Cyrus Questo è difficile. I residui sembrano adattarsi davvero bene alla normalità e non c'è nulla che io possa vedere che sarebbe sbagliato con la regressione lineare. Hai una discreta quantità di dati. Il quadrato R è basso perché la componente del rumore casuale è grande. Il diagramma LOESS mostra una certa curvatura ai valori più bassi della variabile indipendente. Ma non lo trovo convincente. Penso che potrebbe essere lineare e mostrare perché il quadrato R non è un buon indicatore in questo caso.
Michael R. Chernick,

Tq Michael :) Sì, è davvero sconcertante! Tutti i presupposti sono perfettamente soddisfatti ma linearità! Come puoi vedere nel 1 ° grafico sopra, R2 quadratico (0,199) è più grande di R2 lineare (0,172), il che significa che può prevedere meglio il modello. In realtà quando ho fatto la regressione quadratica (aggiungendo SC2) il grafico a dispersione nel risultato era così eteroscedatico! Sono così confuso! Non so cosa fare con questo modello! L'unico problema è la sua bassa linearità. Non so come giustificare la linearità se inserisco il diagramma a dispersione nel mio rapporto. Anche la regressione quadratica non riesce a soddisfare l'assunto di omogeneità. Aiuto
Ciro,

1
Non penso che sia sconcertante. Sembra abbastanza lineare. C'è molta variabilità ed è per questo che il quadrato R è basso. Penso che l'unico modo per ridurre la variabilità sarebbe quello di trovare un'altra variabile esplicativa.
Michael R. Chernick,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.