Come devo modellare le interazioni tra variabili esplicative quando una di esse può avere termini quadratici e cubici?


10

Spero sinceramente di aver formulato questa domanda in modo tale da poter dare una risposta definitiva - in caso contrario, per favore fatemi sapere e proverò di nuovo! Dovrei anche supporre che userò R per queste analisi.

Ho diverse misure di plant performance (Ys)cui sospetto siano state influenzate da quattro trattamenti che ho imposto-- flower thinning (X1), fertilization (X2), leaf clipping (X3)e biased flower thinning (X4). Per tutte le possibili Y, N è almeno 242, quindi le dimensioni del mio campione erano grandi. Tutti i grafici sono stati sottoposti a diradamento o meno, ma ogni diagramma è stato anche sottoposto a uno (e solo uno) degli altri tre trattamenti (oppure no - c'erano anche diagrammi di controllo). L'idea di questo progetto era di verificare se gli altri tre trattamenti fossero in grado di "mascherare" o "migliorare" gli effetti del diradamento. Pertanto, in base alla progettazione, questi ultimi tre trattamenti (X2-X4) non potevano interagire l'uno con l'altro perché non erano incrociati, ma ciascuno di essi può interagire con il diradamento dei fiori - e probabilmente lo fanno.

Le mie ipotesi esplicite sono che 1) il diradamento della fioritura sarà significativo e che 2) anche i termini di interazione, X1*X2, X1*X3, and X1*X4,tra il diradamento dei fiori e gli altri tre trattamenti saranno significativi. Cioè, il diradamento dei fiori dovrebbe avere importanza, ma i modi in cui conta dovrebbero essere modificati in modo significativo da ciò che hanno fatto gli altri tre trattamenti.

Vorrei includere tutte queste informazioni in un modello misto:

Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)

Ma c'è un problema: ho buone ragioni per credere che gli effetti del diradamento su Y non siano lineari. Probabilmente sono quadratici ma forse anche cubici in alcuni casi. Questo perché è molto probabile che gli effetti del diradamento sulle prestazioni aumentino più rapidamente a livelli più elevati di diradamento. Se provo a modellare questa relazione non lineare tramite l'equazione sopra aggiungendo termini quadratici e cubici per X1, allora non sono sicuro di come modellare i termini di interazione - dovrei includere ogni possibile combinazione di X1, (X1) ^ 2 e (X1) ^ 3 * X2, X3 e X4? Perché sembra che ci siano molti parametri da provare per stimare, anche con il numero di punti dati che ho, e non sono sicuro di come interpretare i risultati che otterrei. Detto questo, non ho alcun motivo biologico per pensare che questo sarebbe un modo imprudente per modellare la situazione.

Quindi, ho tre pensieri su come affrontare questo problema:

  1. Montare prima un modello più piccolo, ad esempio Y ~ X1 + X1^2 + X^3 + Random effects, con l'unico scopo di capire se la relazione tra l'assottigliamento e Y sia lineare, quadratica o cubica, quindi trasformare l'assottigliamento tramite una radice quadrata o cubica per linearizzare la relazione in modo appropriato. Da lì, i termini di interazione possono essere modellati come sopra con la variabile trasformata.
  2. Supponiamo che interazioni significative, se si verificano, influenzano solo uno dei termini X1 (ovvero solo il termine lineare, quadratico o cubico) e modellano le interazioni di conseguenza. Non sono nemmeno sicuro che questo approccio abbia senso.
  3. Basta adattare il "modello completo" con ogni possibile termine di interazione tra i termini di assottigliamento e gli altri trattamenti come discusso sopra. Quindi, elimina i termini di interazione insignificanti e usa grafici e altre tecniche per interpretare i risultati.

Quale di questi approcci, se del caso, ha più senso e perché, dato che sono interessato al test delle ipotesi e non alla selezione dei modelli? In particolare, se il n. 1 sopra non ha senso fare, perché? Ho letto questo articolo e questo articolo e ho cercato di digerire cosa potrebbero significare per me, ma anche qualsiasi fonte per ulteriori letture sarebbe molto apprezzata!

Risposte:


7

Nessuno di questi approcci funzionerà correttamente. L'approccio 3. si avvicinò, ma poi hai detto che avresti eliminato i termini insignificanti. Ciò è problematico perché le co-linearità rendono impossibile trovare quali termini rimuovere e perché ciò darebbe i gradi sbagliati di libertà nei test di ipotesi se si desidera preservare l'errore di tipo I.

A seconda delle dimensioni e del segnale effettivi del campione: rapporto di rumore nel problema, suggerirei di adattare un modello a tutti i termini di prodotto e di effetto principale e di interpretare il modello utilizzando grafici e "test di blocco" (test multipli di df di termini correlati, ad es. un test per l'interazione generale, un test per l'interazione non lineare, un test per l'effetto complessivo compreso l'effetto principale + interazione, ecc.). Il rmspacchetto R lo rende facile da eseguire per i modelli univariati standard e per i modelli longitudinali quando è normale multivariato. Esempio:Y

# Fit a model with splines in x1 and x2 and tensor spline interaction surface
# for the two.  Model is additive and linear in x3.
# Note that splines typically fit better than ordinary polynomials
f <- ols(y ~ rcs(x1, 4) * rcs(x2, 4) + x3)
anova(f)   # get all meaningful hypothesis tests that can be inferred
           # from the model formula
bplot(Predict(f, x1, x2))    # show joint effects
plot(Predict(f, x1, x2=3))   # vary x1 and hold x2 constant

Quando vedi la anovatabella vedrai delle linee etichettate All Interactionsche per l'intero modello testano l'influenza combinata di tutti i termini di interazione. Per un singolo predittore questo è utile solo quando il predittore interagisce con più di una variabile. Esiste un'opzione nel printmetodo per anova.rmsmostrare da ciascuna riga della tabella esattamente quali parametri vengono testati rispetto allo zero. Tutto questo funziona con miscele di predittori categorici e continui.

Se si desidera utilizzare normali polinomi, utilizzare polinvece di rcs.

Purtroppo non ho implementato modelli di effetti misti.


1
Grazie per questa risposta Non ho mai usato spline prima, ma penso di capire il tuo esempio. Ho alcune domande di follow-up, se va bene? 1. Quando si osservano i risultati anova da ols, come nel tuo esempio, cosa si intende per "Tutte le interazioni" sotto un fattore? Cioè, tutte le interazioni con cosa? 2. Sarà possibile un approccio simile in un approccio a modellistica mista? Penso di essere bloccato con la necessità di fattori casuali. Il tuo esempio è compatibile, ad esempio, con lme4? 3. Funzionerà se alcuni dei trattamenti interagenti sono categorici? Ad esempio, cosa succede se X2 fosse un fattore di 2 livelli?
Bajcz,

2

Sono un fan dell'utilizzo delle regressioni di livellamento non parametrico per valutare le forme funzionali delle relazioni tra variabili dipendenti e predittori, anche quando successivamente valuterò i modelli di regressione parametrica. Mentre molto spesso ho trovato relazioni non lineari, non ho mai trovato un termine di interazione di interazione non lineare, anche quando gli effetti principali sono fortemente non lineari. Porta a casa: non è necessario che gli effetti di interazione siano composti dalle stesse forme funzionali dei predittori di cui sono composti.


Quindi, per chiarire, il tuo ritorno a casa è che se scelgo l'opzione # 2, posso tranquillamente includere solo termini di interazione con il termine X1 lineare e non preoccuparmi di "termini di interazione di ordine superiore", ad esempio X1 ^ 2 * X3 e così via?
Bajcz,

1
@Bajcz Beh ... immagino di dire due cose: (1) sono riuscito a cavarmela nei set di dati che ho incontrato con interazioni solo lineari, ma anche (2) mi piace guardare (usando regressioni non parametriche) e lascia che i dati mi dicano se devo considerare o meno alternative non lineari. [Adottare un approccio modello o test di ipotesi a termini non lineari è l'IMO il modo sbagliato di procedere, dal momento che ciò implica, ad esempio, inferenza basata, ad esempio, su un insieme arbitrario di termini polinomiali, piuttosto che sui dati stessi.]
Alexis,

3
Non vi sono grandi ragioni per ritenere che le interazioni abbiano maggiori probabilità di essere lineari. Mi sono imbattuto in grandi esempi di interazioni non lineari. L'idea di "guardare" e "lasciare che i dati ti diano" è piena di problemi di inferenza tra cui problemi di copertura dell'intervallo di sfiducia.
Frank Harrell,

1
@FrankHarrell Grazie! La tua prima frase è esattamente il punto che stavo cercando di esprimere nel mio (2) nel commento sopra (la mia esperienza passata può variare in modo drammatico in futuro). OTOH: non lasciare che i dati parlino è un'ottima strategia per imputare inferenze su artefatti di ipotesi di modellazione su inferenze sui dati reali.
Alexis,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.