La frequenza degli alleli osservati è significativamente inferiore a quella prevista?


10

Domanda : Come posso costruire un test per determinare se la frequenza osservata "montagna" -allele (Fig 1) è significativamente più bassa nelle montagne dal centro al sud di quanto previsto (Fig 2) dal modello di selezione ecologica ( vedi sotto per i dettagli )?

Problema : il mio pensiero iniziale era di regredire i residui del modello rispetto alla latitudine: longitudine e altitudine (il che si traduce in una significativa interazione tra latitudine e longitudine). Il problema è che i residui (Fig. 3) possono riflettere variazioni non spiegate dal modello e / o che il loro è qualcosa di biologico, ad esempio l'allele non ha avuto il tempo di diffondersi a sud verso il suo potenziale o c'è qualche barriera al flusso genico. Se si confrontano le frequenze osservate (Fig1) con quelle attese (Fig 2) di montagna-allele, c'è una differenza evidente soprattutto nelle montagne centrali e meridionali della Svezia e della Norvegia. Accetto che il modello possa non spiegare tutte le variazioni, ma posso trovare un test ragionevole per esplorare l'idea che l'allele di montagna non ha raggiunto il suo potenziale nelle montagne centrali e meridionali?

sfondo: Ho un marcatore AFLP bi-allelico la cui distribuzione di frequenza sembra essere associata alla montagna (e latitudine: longitudine) rispetto agli habitat di pianura sulla penisola scandinava (Fig 1). La "montagna" -allele è quasi fissa nel nord, che è montuoso. È quasi assente o riparato per la "pianura" -allele nel sud, che manca di montagne. Mentre ci si sposta da nord a sud in montagna, l'allele "montagna" si presenta con una frequenza più bassa. Questa differenza nella frequenza di "montagna" -allele da nord a sud può essere semplicemente dovuta alla fillogeografia o ai processi storici, poiché la regione è stata colonizzata da nord e da sud. Ad esempio, se l'allele montano ha origine nella popolazione settentrionale, forse non ha avuto il tempo di espandersi completamente nella popolazione meridionale,

La mia ipotesi di lavoro è che la frequenza "di montagna" -allele è il risultato di una selezione ecologica (l'ipotesi nulla è una selezione neutra).

Per il mio modello di selezione ecologica, ho usato un modello di additivo generalizzato (GAM) con la frequenza allele binomiale come variabile di risposta (129 siti campionati attraverso Fennoscandinavia con tipicamente da 10 a 20 individui campionati in ciascun sito) e diverse variabili climatiche e di stagione crescente come le variabili predittive. I risultati del modello sono i seguenti (TMAX04-06 = temperatura massima in aprile-giugno, Phen_NPPMN = produttività media della vegetazione della stagione di crescita, PET_HE_YR = evapotraspirazione potenziale annuale, Dist_Coast = distanza dalla costa):

Family: binomial 
Link function: logit 

Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) + 
s(PET_HE_YR) + s(Dist_Coast)

Parametric coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -0.74372    0.04736   -15.7   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Approximate significance of smooth terms:
             edf Ref.df Chi.sq  p-value    
s(TMAX_04)    3.8100  4.812 25.729 9.43e-05 ***
s(TMAX_05)    0.8601  1.000  5.887  0.01526 *  
s(TMAX_06)    0.8862  1.000  7.644  0.00569 ** 
s(Phen_NPPMN) 6.2177  7.375 39.028 3.16e-06 ***
s(PET_HE_YR)  3.1882  4.147 18.039  0.00145 ** 
s(Dist_Coast) 2.2882  2.857  9.725  0.01906 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

R-sq.(adj) =  0.909   Deviance explained = 89.7%
REML score = 326.73  Scale est. = 1         n = 129

inserisci qui la descrizione dell'immagine

Figura 1. Frequenza allele "montana" osservata per marker AFLP bi-allelico. Linee di contorno 0,1 intervalli di frequenza, l'ombreggiatura del colore è altitudine con i blu più bassi e i rossi più alti.

inserisci qui la descrizione dell'immagine

Figura 2. Frequenza allele "di montagna" prevista per marker AFLP bi-allelico. Linee di contorno 0,1 intervalli di frequenza, l'ombreggiatura del colore è altitudine con i blu più bassi e i rossi più alti.

inserisci qui la descrizione dell'immagine

Figura 3. Residui del modello di selezione ecologica (usando GAM) suddivisi per l'intera area di studio (Fennoscandinavia) e separatamente per Norvegia, Svezia e Finlandia. Le linee tratteggiate rosse rappresentano una zona di contatto secondaria tra le popolazioni settentrionali e meridionali dedotta da altri marcatori AFLP e un'analisi isotopica stabile delle piume coltivate sui loro terreni di svernamento separati in Africa. La sottile linea tratteggiata nera è il centro della zona.


1
Grazie per la grande quantità di dettagli. Come si pone il modello null nella domanda? Sembra che solo il modello di selezione ecologica sia importante nel confronto tra osservato e atteso.
gui11aume,

Quali sono i tuoi dati attuali qui? L'output del modello dice "n = 129", ma sono 129 individui o 129 posizioni in ciascuna delle quali si hanno frequenze alleliche o ...?
onestop,

Mi dispiace aver voluto fornire il maggior numero di informazioni possibili per consentire a tutti voi di comprendere meglio la logica (o illogica) del mio approccio per il manoscritto che sto sviluppando. La mia domanda è in cima, vorrei trovare un perché per determinare se la differenza tra osservata e attesa è significativamente diversa. Questo potrebbe informarmi se l'allele si sta ancora diffondendo o c'è qualche barriera nel raggiungere il valore atteso. Per quanto riguarda "N = 129", poiché si tratta di una frequenza allelica, ciò significa 129 siti con tipicamente tra 10 e 20 individui campionati in ciascun sito.
Keith Larson,

Lei afferma che gli individui sembrano essere panmittici per i loci materni e automsomali. Hai accesso a questi dati? Come hai valutato la panmixia?
Sameer,

Risposte:


1

Questa domanda potrebbe essere morta, ma i grafici qui sono meravigliosi e la risposta qui sembra intuitivamente ovvia. Se stai cercando un allele "montagna", la scelta ovvia sarebbe quella di usare l'altitudine (o un po 'di surrogato) come tuo predittore. Se ciò mostrasse un'associazione significativa con la frequenza degli alleli, fornirebbe prove concrete per la tua ipotesi.

È possibile aggiungere più variabili predittive che descrivono altri aspetti della montagna rispetto alla sua altitudine - ad esempio, "rugosità" del terreno o tipo di vegetazione - che sono unicamente montuose e possono anche essere associate alla frequenza degli alleli.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.