Bene, poiché il tuo modello è lineare, con il mpg previsto uguale al predittore lineare, puoi leggere mpg direttamente dalla scala del predittore lineare.
Per ogni variabile, trovi il suo valore sulla scala pertinente. Ad esempio, immagina di voler trovare un mpg previsto per un'auto con wt=4, am=1, qsec=18
:
che fornisce un mpg previsto di circa 18,94. Sostituire l'equazione dà 18,95, quindi è abbastanza vicino. (In pratica probabilmente lavoreresti solo al punto intero più vicino - e quindi ottieni una precisione di circa 2 cifre - "19 mpg" - fuori, piuttosto che 3-4 figure come qui.)
Uno dei principali vantaggi di un simile diagramma secondo me è che si vede immediatamente l'effetto relativo dei cambiamenti nelle diverse variabili predittive (IV) sulla risposta (DV). Anche quando non è necessario il diagramma per alcun calcolo, può avere un grande valore in termini di semplice visualizzazione degli effetti relativi delle variabili.
Domanda di follow-up dai commenti:
Funziona allo stesso modo per le regressioni non lineari o polinomiali?
E(Y)y^=b0+bx1+f(x2)
dove uno dei due:
f
f
x1
x2f
x2
f(x)x=2.23
È possibile che tali funzioni abbiano diversi punti di svolta, in cui le scale si spezzerebbero e si ribalterebbero più volte, ma la linea dell'asse ha solo due lati.
Con i nomogrammi a punti questo non presenta alcuna difficoltà, dal momento che si possono spostare leggermente verso l'alto o verso il basso sezioni di scala aggiuntive (o più in generale, ortogonalmente alla direzione dell'asse) fino a quando non si verifica alcuna sovrapposizione.
(Più di un punto di svolta può essere un problema per i nomogrammi di tipo allineamento; una soluzione mostrata nel libro di Harrell è quella di compensare leggermente tutte le scale da una linea di riferimento, su cui viene effettivamente presa la posizione del valore.)
Y
Esempi di tutte queste situazioni sono disponibili nelle Strategie di modellizzazione della regressione di Harrell .
Solo un paio di note collaterali
Preferirei di gran lunga vedere due scale dei punti, nella parte superiore e inferiore della sezione pertinente; altrimenti è difficile "allinearsi" con precisione perché bisogna indovinare cos'è "verticale". Qualcosa come questo:
Tuttavia, come noto nei commenti, per l'ultima sezione del diagramma (punti totali e predittore lineare) forse un'alternativa migliore a una seconda scala di punti sarebbe quella di avere semplicemente una coppia di scale back-to-back (punti totali su una lato, predittore lineare dall'altro), in questo modo:
quindi evitiamo la necessità di sapere cosa sia "verticale".
Con solo due predittori continui e un singolo fattore binario, possiamo facilmente costruire un nomogramma di allineamento più tradizionale :
In questo caso trovi semplicemente i valori wt
e qsec
sulle loro scale e li unisci con una linea; dove attraversano l' mpg
asse, leggiamo il valore (mentre la am
variabile determina quale lato mpg
dell'asse leggi). In un caso semplice come questo, questo tipo di nomogrammi è più veloce e più semplice da usare, ma può essere meno facile da generalizzare a molti predittori, dove possono diventare ingombranti. Il nomogramma a punti nella tua domanda (come implementato in Regressione Modeling Strategies e nel rms
pacchetto in R) può aggiungere più variabili senza soluzione di continuità. Questo può essere piuttosto un vantaggio quando si tratta di interazioni.