Modello di rischio proporzionale di Cox e interpretazione dei coefficienti in caso di interazione tra maiuscole e minuscole


9

Ecco l'output di riepilogo del modello Coxph che ho usato (ho usato R e l'output si basa sul miglior modello finale, ovvero sono incluse tutte le variabili esplicative significative e le loro interazioni):

 coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 + 
Food:Temp2 + LT:Food:Temp2) # Y<-Surv(Time,Status==1)

n = 555

               coef         exp(coef)          se(coef)      z           Pr(>|z|)     
LT             9.302e+02      Inf             2.822e+02    3.297        0.000979 *** 
Food           3.397e+03      Inf             1.023e+03    3.321        0.000896 *** 
Temp2          5.016e+03      Inf             1.522e+03    3.296        0.000979 *** 
LT:Food        -2.250e+02    1.950e-98        6.807e+01    -3.305       0.000949 *** 
LT:Temp2       -3.327e+02    3.352e-145       1.013e+02    -3.284       0.001022 ** 
Food:Temp2     -1.212e+03    0.000e+00        3.666e+02    -3.307       0.000942 *** 
LT:Food:Temp2   8.046e+01    8.815e+34        2.442e+01     3.295       0.000986 *** 
--- 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Rsquare= 0.123   (max possible= 0.858 ) 
Likelihood ratio test= 72.91  on 7 df,   p=3.811e-13 
Wald test            = 55.79  on 7 df,   p=1.042e-09 
Score (logrank) test = 78.57  on 7 df,   p=2.687e-14 

La domanda è:

Come interpretare i valori di coefficiente ed exp (coef) in questo caso, poiché sono valori molto grandi? È coinvolta anche l'interazione a 3 casi, che confonde maggiormente l'interpretazione.

Tutti gli esempi riguardanti il ​​modello Coxph che ho trovato finora online sono stati molto semplici per quanto riguarda i termini di interazione (che si sono sempre rivelati insignificanti) e anche i valori dei coefficienti (= tassi di rischio) e gli esponenziali di questi (= rapporti di rischio) sono stati numeri abbastanza piccoli e "facili da gestire", ad esempio coefficiente = 1,73 -> exp (coef) = 5,64. MA i miei sono numeri molto più grandi, come puoi vedere dall'output di riepilogo (sopra). E poiché sono luoghi così grandi, sembrano quasi non avere alcun senso.

Sembra un po 'ridicolo pensare che la sopravvivenza sia, ad esempio, 8,815e + 34 (hazard ratio tratto dall'interazione LT: Food: Temp2) volte inferiore quando l'interazione aumenta di un'unità (?).

In realtà non so nemmeno come interpretare questa interazione in 3 casi. Significa che quando tutte le variabili nell'interazione aumentano di una unità, la sopravvivenza diminuisce di una certa quantità (raccontata dal valore exp (coef))?

Sarebbe bello se qualcuno mi potesse aiutare qui. :)

Di seguito è la parte della mia scheda tecnica che ho usato per l'analisi cox. Qui puoi vedere che ho usato molte volte lo stesso valore di variabe esplicativo (cioè LT, Food e Temp2) per diversi "Tempo, Variabile di risposta dello stato". Questi valori delle variabili esplicative sono già i valori medi di queste variabili (a causa della configurazione del lavoro sul campo nella natura, non è stato possibile ottenere il valore della variabile esplicativa individuale per ciascun individuo di risposta osservato, quindi i valori medi utilizzati già in questa fase ) e questo risponderebbe al suggerimento 1 (?) (vedere la prima risposta).

Suggerimento 2 (vedi la prima risposta): sto usando R, e non ci sono ancora super dio. :) Quindi, se uso la funzione di previsione (cox.model, type = "previsti"), ottengo una quantità enorme di valori diversi e non ho idea di quale variabile esplicativa si riferiscano e in quale ordine. O è possibile evidenziare un determinato termine di interazione nella funzione di previsione? Non sono sicuro se mi sto chiarendo molto qui.

Suggerimento 3 (vedi prima risposta): nella parte della scheda tecnica in basso, si possono vedere le unità di diverse variabili esplicative. Sono tutti diversi e includono decimali. Questo può avere qualcosa a che fare con il risultato di Cox?

Parte della scheda tecnica:

Time (days)     Status      LT(h) Food (portions per day) Temp2 C)
28                0         14.42        4.46             3.049
22                0         14.42        4.46             3.049
9                 1         14.42        4.46             3.049
24                0         15.33        4.45             2.595
24                0         15.33        4.45             2.595
19                1         15.33        4.45             2.595

Saluti, Unna


@MansT: Bello, hai modificato la domanda ;-)
ocram,

Risposte:


7

Un paio di suggerimenti, non direttamente correlati a CoxPH ma a interazioni e collinearità

1) Quando stai diventando valori "pazzi" come questi, una possibilità è la collinearità. Questo è spesso un problema quando si hanno interazioni. Hai centrato tutte le tue variabili (sottraendo la media da ciascuna)?

2) Non puoi interpretare un'interazione tra molte abbastanza facilmente. LT, cibo e temp2 sono tutti coinvolti in molte interazioni. Quindi, guarda i valori previsti da diverse combinazioni.

3) Controllare le unità delle diverse variabili. Quando ottieni parametri pazzi, a volte è un problema di unità (ad es. Misurare un'altezza umana in millimetri o chilometri)

4) Una volta chiarita quella roba, trovo il modo più semplice di pensare agli effetti di interazioni diverse (specialmente quelle di livello superiore) è quello di rappresentare graficamente i valori previsti con diverse combinazioni di valori indipendenti.


Ehi, di seguito è la parte della mia scheda tecnica che ho usato per l'analisi cox. Qui puoi vedere che ho usato molte volte lo stesso valore variabe esplicativo (cioè LT, Food, e Temp2) per diverse variabili Time, Status response. Questi valori delle variabili esplicative sono già i valori medi di queste variabili (a causa della configurazione del lavoro sul campo nella natura, non è stato possibile ottenere il valore della variabile esplicativa individuale per ciascun individuo di risposta osservato, quindi i valori medi utilizzati già in questa fase ) e questo risponderebbe al suggerimento 1 (?).
Unna,

Suggerimento 2: sto usando R, e non ci sono ancora super dio. :) Quindi, se uso la funzione di previsione (cox.model, type = "previsti"), ottengo una quantità enorme di valori diversi e non ho idea di quale variabile esplicativa si riferiscano e in quale ordine. O è possibile evidenziare un determinato termine di interazione nella funzione di previsione? Non sono sicuro se mi sto chiarendo molto qui.
Unna,

Suggerimento 3: nella parte della scheda tecnica in basso, si possono vedere le unità di diverse variabili esplicative. Sono tutti diversi e includono decimali. Questo può avere qualcosa a che fare con il risultato di Cox?
Unna,

Tempo (giorni) Stato LT (h) Alimenti (porzioni al giorno) Temp2 (ºC) 28 0 14,42 4,46 3,049 22 0 14,42 4,46 3,049 9 1 14,42 4,46 3,049 24 0 15,33 4,45 2,595 24 0 15,33 4,45 2,595 19 1 15,33 4,45 2,595
Unna,

Il commento sopra sull'esempio della scheda tecnica che ho usato non mostra la forma di una tabella, ma spero che sia possibile dargli un senso. :)
Unna,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.