Variabili filogenetiche dipendenti: ANOVA?


13

Capisco derivare una matrice di covarianza dai dati filogenetici per rendere per due variabili su cui si sta facendo una regressione. Ma cosa succede se hai una variabile continua, che in precedenza hai dimostrato di dipendere dalla filogenesi e una variabile ordinale? Essendo quest'ultimo ordinale, non sono sicuro di come collegarlo al modo in cui la dipendenza filogenetica risulta in statistiche di test distorte.cov(X,Y)=0

È significativo calcolare i Contrasti filogenetici indipendenti di Felsenstein sulla tua variabile continua e usarli per la tua ANOVA?

Il valore PIC è:

Cioj=(Xio-Xj)dioj

Dove è X per la specie i , X j è X per la specie j e d i j è la distanza a coppie tra le specie i e j sull'albero filogenetico.XioXio,XjXjdiojioj


1
Ci sono abbastanza statistici applicati su CrossValidated che potremmo voler considerare la migrazione di questo al sito delle statistiche.
Daniel Standage,

2
Consiglierei la mailing list r-sig- phylo ( stat.ethz.ch/mailman/listinfo/r-sig-phylo ). Anche se non stai usando R per la tua analisi, otterrai ottime risposte alla tua domanda.
kmm,

Risposte:


1

Il primo passo che consiglierei è introdurre una variabile fittizia per ciascuna classe ordinale (vedi commenti su https://www.google.com/url?sa=t&source=web&rct=j&ei=B9r5U67pH8vfsASwq4GADQ&url=http://www.uta edu / facoltà / kunovich / Soci5304_Handouts / argomento% 25208_Dummy% 2520Variables.doc & cd = 2 & ved = 0CCAQFjAB & usg = AFQjCNEX-TD7RjSYZ-ej32_5tgPTxVVdvQ & SIG2 = 9hkDU6Y2mpKcGzBTIK8jog ) e tracciare rispettivi mezzi dall'analisi di regressione variabile dummy. Puoi anche testare una tendenza nelle variabili fittizie stesse. È inoltre possibile riordinare la categoria di variabili ordinali per la rispettiva grandezza stimata delle variabili fittizie per l'analisi successiva se esiste una giustificazione precedente (per vedere i dati attuali) per farlo.

Supponendo che all'analisi precedente manchi un effetto di tendenza crescente (non necessariamente lineare) e che incorpori qualsiasi ordinamento sostenibile nella variabile ordinale stessa, un approccio interessante che affronti anche possibili problemi di normalità, è quello di eseguire un'analisi di regressione in cui a tutte le variabili sono assegnati gradi, compresa la variabile ordinale. Una logica per questa follia, per citare da Wikipedia sul coefficiente di correlazione di grado di Spearman (link: http://en.m.wikipedia.org/wiki/Spearman's s_rank_correlation_coefficient):

"Il coefficiente di Spearman, come ogni calcolo di correlazione, è appropriato sia per le variabili continue che per quelle discrete, comprese le variabili ordinali. [1] [2]"

Wikipedia presenta un esempio e diversi modi per valutare l'errore standard della correlazione del rango calcolato per i test. Nota, se non è statisticamente diverso da zero, una versione ridimensionata, come in una regressione calcolata in base ai gradi, è similmente non significativa.

Vorrei ulteriormente normalizzare questi ranghi (dividendo per il numero di osservazioni), dando una possibile interpretazione quantile di esempio (si noti che ci sono possibili perfezionamenti nella costruzione della distribuzione empirica per i dati in questione). Eseguirò anche una semplice correlazione tra y e una determinata variabile ordinale trasformata in modo che la direzione della classifica selezionata (ad esempio, da 1 a 4 contro 4 a 1), produca un segno per la correlazione di rango che abbia un significato intuitivo nel contesto del tuo studio.

[Modifica] Si noti che i modelli ANOVA possono essere presentati in formato di regressione con la matrice di progettazione appropriata e con qualsiasi modello di regressione standard che si indaga, il tema centrale è un'analisi basata sulla media di Y data X. Tuttavia, in alcune discipline come l'ecologia, una diversa attenzione alle relazioni di regressione implicate in vari quantili, compresa la mediana, si è dimostrata fruttuosa. Apparentemente in ecologia gli effetti medi possono essere piccoli, ma non necessariamente in altri quantili. Questo campo è chiamato regressione quantile. Ti suggerirei di utilizzarlo per integrare la tua analisi attuale. Come riferimento, potresti trovare utile il documento 213-30, "Un'introduzione alla regressione quantile e alla procedura QUANTREG" di Colin (Lin) Chen presso il SAS Institute.

Ecco anche una fonte sull'uso delle trasformazioni di rango: "L'uso delle trasformazioni di rango nella regressione" di Ronald L. Iman e WJ Conover, pubblicato su Technometrics, Vol 21, n. 4, novembre 1979. L'articolo rileva che le regressioni impiegando trasformazioni di rango sembrano funzionare abbastanza bene su dati monotonici. Questa opinione è condivisa anche dai professionisti dell'affidabilità, che affermano su una rivista online, di citare: "Il metodo di stima della regressione di grado è abbastanza buono per le funzioni che possono essere linearizzate". Fonte: "Affidabilità Hotwire, numero 10, dicembre 2010.


un utente anonimo ha cercato di apportare modifiche abbastanza estese (IMO) al tuo post. Se non sei d'accordo con loro, puoi ripristinarli facendo clic sul link "modificato __ ago", trovando l'ultima versione che preferisci e facendo clic su "rollback".
gung - Ripristina Monica

0

Un test filogenetico ANOVA è stato sviluppato da Garland et al. (1993) , ed è implementato nella phy.anovafunzione nel geigerpacchetto. Il metodo produce valori di p corretti per la non indipendenza filogenetica generando una distribuzione nulla basata sulla simulazione dell'evoluzione della filogenesi.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.