Come descrivere o visualizzare un modello di regressione lineare multipla


21

Sto cercando di adattare un modello di regressione lineare multipla ai miei dati con un paio di parametri di input, diciamo 3.

(i)F(x)=Ax1+Bx2+Cx3+dor(ii)F(x)=(A B C)T(x1 x2 x3)+d

Come posso spiegare e visualizzare questo modello? Potrei pensare alle seguenti opzioni:

  1. Indicare l'equazione di regressione come descritto in (coefficienti, costante) insieme alla deviazione standard e quindi un diagramma di errore residuo per mostrare l'accuratezza di questo modello. (i)

  2. Grafici a coppie di variabili indipendenti e dipendenti, in questo modo:

    inserisci qui la descrizione dell'immagine

  3. Una volta noti i coefficienti, i punti di dati utilizzati per ottenere l'equazione essere condensati ai loro valori reali. Cioè, i dati di allenamento hanno nuovi valori, nella forma anziché , , , cui ciascuna variabile indipendente viene moltiplicata per il rispettivo coefficiente. Quindi questa versione semplificata può essere visivamente mostrata come una semplice regressione come questa:x x 1 x 2 x 3 ...(i)xx1x2x3

    inserisci qui la descrizione dell'immagine

Sono confuso su questo, nonostante abbia esaminato il materiale appropriato su questo argomento. Qualcuno può spiegarmi come "spiegare" un modello di regressione lineare multipla e come mostrarlo visivamente.


2
Qual è lo scopo del tuo documento e chi sono i pubblici? Comincerei da ottenere articoli simili e cerco alcuni esempi su come sono fatti nel tuo campo. Conosco meglio la letteratura biomedica e la maggior parte delle volte usiamo solo una tabella. Le illustrazioni sono più spesso viste quando gli autori cercano di spiegare un'interazione.
Penguin_Knight

@Penguin_Knight, questo è nel dominio dell'informatica, tuttavia penso che questo sia un generico piuttosto che limitato a un determinato dominio. Per favore correggimi se sbaglio.
Kris,

Hmm ... comunque domanda. Direi che l'unica parte generica, per me, è non mostrare più di quanto dovresti, e assicurarti che i componenti da enfatizzare vengano davvero enfatizzati. Anche nel mio campo ho visto tutte e tre le opzioni. 1) la tabulazione dei risultati è la più comune, seguita da 3), ma principalmente la forma di tracciare il risultato previsto, e quindi 2). Ma per 2), userei ciò che suggeriva @gregory_britten: usa X regolata invece di ogni singola X.
Penguin_Knight

usa il diagramma di distribuzione .... guarda la distribuzione dei valori adattati risultanti dal modello e confrontalo con la distribuzione dei valori effettivi.
Owais Qureshi

So che è di anni fa, ma se riesci a visitare di nuovo qui, potresti pubblicare i dati? Quindi le persone avrebbero qualcosa su cui lavorare per mostrare diverse possibilità.
gung - Ripristina Monica

Risposte:


21

Il mio modo preferito di mostrare i risultati di una regressione lineare multipla di base è prima di tutto adattare il modello a variabili (continue) normalizzate. Cioè, z-trasforma le s sottraendo la media e dividendole per la deviazione standard, quindi adattando il modello e stimando i parametri. Quando le variabili vengono trasformate in questo modo, i coefficienti stimati vengono "standardizzati" per avere unità . In questo modo, la distanza dei coefficienti da zero classifica la loro 'importanza' relativa e il loro CI fornisce la precisione. Penso che riassuma piuttosto bene le relazioni e offra molte più informazioni rispetto ai coefficienti e ai valori p. Sulle loro scale numeriche naturali e spesso disparate. Un esempio è di seguito:Δ Y / Δ s d ( X )XΔY/Δsd(X)

inserisci qui la descrizione dell'immagine

EDIT: Un'altra possibilità è quella di utilizzare un "diagramma variabile aggiunto" (ovvero tracciare le regressioni parziali). Ciò fornisce un'altra prospettiva in quanto mostra le relazioni bivariate tra e DOPO LE ALTRE VARIABILI PER LE CONTABILI. Ad esempio, le regressioni parziali di darebbero relazioni bivariate tra rispetto ai residui di dopo la regressione rispetto agli altri due termini. Continueresti a farlo per ogni variabile. La funzione dalla libreria fornisce questi grafici da un oggetto montato . Un esempio è di seguito: X i Y X 1 + X 2 + X 3 X i YYXiYX1+X2+X3XiYavPlots()carlm

inserisci qui la descrizione dell'immagine


Grazie @gregory_britten per queste informazioni. Il problema che ho a portata di mano ha 8 variabili indipendenti. Pensi che i "grafici variabili aggiunti" sarebbero ragionevoli per un gran numero di variabili di input?
Kris,

In linea con l'idea della prima trama, se si lavora in R, suggerisco di guardare il pacchetto RMS che rende tutto questo facile. La cosa bella è che si possono chiedere cambiamenti significativi nella covarianza, evitando così la necessità di standardizzare.
Thomas Speidel,

@suzanne Sì, sicuramente. Il grafico delle variabili aggiunto offre prospettive bidimensionali per qualsiasi numero di variabili. Può essere particolarmente rivelatore in dimensioni superiori. Si trovano spesso modelli rivelatori nei residui che non erano affatto evidenti nella Y osservata.
gregory_britten

Non capisco bene la notazione X1 | X2 e X3 in questo contesto. So come viene usata per quanto riguarda le probabilità, ma non riesco proprio a capire cosa stia dicendo qui
Casebash

1
@Casebash È la regressione parziale su X1, dato che X2 e X3 sono nel modello
gregory_britten

1

Dal momento che tutti hanno a che fare con la spiegazione dei contributori per la cirrosi, hai provato a fare un grafico a bolle / cerchio e usare il colore per indicare i diversi regressori e il raggio del cerchio per indicare l'impatto relativo sulla cirrosi?

Mi riferisco qui a un tipo di grafico di Google che assomiglia a questo:inserisci qui la descrizione dell'immagine

E su una nota non correlata, a meno che non stia leggendo le tue trame in modo sbagliato, penso che ci siano dei regressori ridondanti lì dentro. Il vino è già un liquore, quindi se quei due sono regressori separati non ha senso mantenerli entrambi, se il tuo obiettivo è spiegare l'incidenza della cirrosi.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.