Come convertire coefficienti standardizzati in coefficienti non standardizzati?


11

Il mio obiettivo è quello di utilizzare i coefficienti derivati ​​da ricerche precedenti sull'argomento per prevedere i risultati effettivi dati un insieme di variabili indipendenti. Tuttavia, il documento di ricerca elenca solo i coefficienti Beta e il valore t. Vorrei sapere se è possibile convertire i coefficienti standardizzati in coefficienti non standardizzati.

Sarebbe utile convertire le mie variabili indipendenti non standardizzate in quelle standardizzate per calcolare il valore previsto? Come potrei tornare a un valore previsto non standardizzato (se ciò è persino possibile ...)

Aggiunta riga di esempio dalla carta:

Numero di linee di autobus (linee di autobus) | 0,275 (Beta) | 5,70 *** (valore t)

Mi viene anche dato questo riguardo alle variabili indipendenti:

Numero di linee di autobus (linee di autobus) | 12,56 (media) | 9.02 (Std) | 1 (min) | 53 (max)


Come sono stati standardizzati i coefficienti? In generale, i hanno un'unità che è l'unità di divisa per l'unità di , qual è la loro unità nel documento? βYX
gui11aume,

1
Non sono sicuro di aver capito la tua domanda. Ecco una riga di esempio di una variabile indipendente dopo l'analisi di regressione dal documento. Caratteristiche di fornitura del transito: numero di linee di autobus (linee di autobus) | 0,275 (Beta) | 5,70 *** (valore t)

Il coefficiente stesso non è standardizzato come menzionato in gui11. Ma la statistica è il coefficiente stimato diviso per la sua deviazione standard stimata. Dati te gradi di libertà potresti calcolare il valore p e la deviazione standard stimata perché Beta = valore t x deviazione standard stimata. Ma non sono sicuro se questo è quello che stai cercando. La stima beta non è standardizzata. La statistica t è la forma standardizzata della stima del battito. Quindi hai già il coefficiente standardizzato.
Michael R. Chernick,

Risposte:


14

Sembra che il documento utilizzi un modello di regressione multipla nel modulo

Y=β0+iβiξi+ε

dove sono versioni standardizzate delle variabili indipendenti; cioè. ,ξi

ξi=ximisi

con la media (come 12.56 nell'esempio) e la deviazione standard (come 9.02 nell'esempio) dei valori della variabile ('buslines' nell'esempio). è l'intercetta (se presente). Collegare questa espressione al modello adattato , con i suoi "beta" scritti come (0,275 nell'esempio) e fare un po 'di algebra fornisce le stimemisiithxiβ0βi^

Y^=β0^+iβi^ximisi=(β0^(iβimi^si))+i(βi^si)xi.

Ciò dimostra che i coefficienti di nel modello (a parte il termine costante) sono ottenuti dividendo i beta per le deviazioni standard delle variabili indipendenti e che l'intercetta viene regolata sottraendo una combinazione lineare adeguata dei beta.xi

Questo ti dà due modi per prevedere un nuovo valore da un vettore di valori indipendenti:(x1,,xp)

  1. Utilizzando i mezzi e le deviazioni standard come riportato nel documento (non ricalcolato da nessun nuovo dato!), Calcola e inseriscili nella formula di regressione data dai beta o, equivalentemente,misi (ξ1,,ξp)=((x1m1)/s1,,(xpmp)/sp)

  2. Collegare nella formula algebricamente equivalente derivata sopra.(x1,,xp)

Se il documento utilizza un modello lineare generalizzato , potrebbe essere necessario seguire questo calcolo applicando la funzione "link" inversa a . Ad esempio, con la regressione logistica sarebbe necessario applicare la funzione logistica per ottenere la probabilità prevista ( sono le probabilità del log previste).Y^1/(1+exp(Y^))Y^


Perfetto, grazie! Ho avuto l'aiuto di un collega. Un'altra domanda però: il mio nuovo valore (Y-hat) è molto basso. L'autore utilizza una variabile dipendente trasformata logaritmicamente nella sua regressione. Vuol dire che dovrei espandere (Y-hat) per espanderlo all'unità di misura non trasformata.

Inoltre, nel documento non è inclusa l'intercettazione Y e testare il metodo exp (cappello a Y) sembra indicare che dovrebbe esserci un valore per l'intercettazione Y che rappresenti parte della varianza non spiegata dal modello, in ordine elevare il risultato previsto a un livello ragionevole.

Quindi non sono i coefficienti a essere classificati. Sono le variabili.
Michael R. Chernick,

1
Michael M, sì, è probabilmente quello che vuoi e sì, devi scoprire qual è l'intercettazione. Potrebbe essere necessario confonderlo indovinando l'intercettazione e variandolo fino a quando il modello sembra riprodurre qualsiasi grafica e tabella nel foglio in modo sufficientemente preciso. exp(y^)
whuber

Se stai cercando di fare ciò che il titolo richiede, guarda qui: www3.nd.edu/~rwilliam/stats1/x92.pdf se anche y è standardizzato. Vedi anche stats.stackexchange.com/questions/235057/…
Chris,

1

B=p×sysx
  • x è la variabile indipendente
  • y è la variabile dipendente
  • s è la deviazione standard
  • p è il coefficiente del percorso
  • B è il coefficiente di regressione.

2
Non sono sicuro di quale sia un coefficiente di percorso. Sembra che forse B sia un coefficiente di regressione che non sarebbe privo di dimensioni. Sarebbe in y unità per 1 x unità. Tuttavia p = B sx / sy dove sx è la deviazione standard stimata in x divisa per la deviazione standard stimata in yep è senza dimensioni. Rappresenta una correlazione stimata tra xe y. Lancia se questo è quello che volevi, per favore apporta le modifiche modificando il tuo post.
Michael R. Chernick,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.