Con quale probabilità discenderò da una persona in particolare nata nel 1300?


26

In altre parole, in base a quanto segue, che cos'è p?

Per rendere questo un problema di matematica piuttosto che antropologia o scienze sociali e per semplificare il problema, supponi che i compagni siano selezionati con uguale probabilità in tutta la popolazione, tranne che i fratelli e i cugini di primo grado non si accoppiano mai e che i compagni siano sempre scelti dalla stessa generazione.

  • n1 - popolazione iniziale
  • g - il numero di generazioni.
  • c - il numero medio di figli per coppia. (Se necessario per la risposta, supponi che ogni coppia abbia esattamente lo stesso numero di figli.)
  • z - la percentuale di persone che non hanno figli e che non sono considerate parte di una coppia.
  • n 2 zn2 - popolazione alla generazione finale. (O o dovrebbero essere dati e (penso) l'altro può essere calcolato.)n2z
  • p - probabilità che qualcuno nella generazione finale discenda da una persona in particolare nella generazione iniziale.

Queste variabili possono essere modificate, omesse o aggiunte, ovviamente. Presumo per semplicità che e non cambino nel tempo. Mi rendo conto che questo otterrà una stima molto approssimativa, ma è un punto di partenza.cz

Parte 2 (suggerimento per ulteriori ricerche):

Come puoi considerare che i compagni non sono selezionati con probabilità uniforme a livello globale? In realtà, i compagni hanno più probabilità di avere la stessa area geografica, background socio-economico, razza e background religioso. Senza ricercare le effettive probabilità per questo, come potrebbero entrare in gioco le variabili per questi fattori? Quanto sarebbe importante?


2
è una domanda a casa? Altrimenti, qual è il contesto?
David LeBauer,

1
@Giovanni: grazie per la modifica. Credo che il consenso prevalente (su questo sito e altri) sia che non modifichiamo le domande semplicemente per aggiungere il homeworktag. È meglio per tutti i soggetti coinvolti lasciare che l'OP lo faccia. Potresti essere interessato a questo meta thread se non l'hai già visto.
cardinale il

Sono solo curioso. Non sono uno studente e questi non sono i compiti di nessuno. Stavo solo scherzando sul credito in più, anche se posso vedere come implicherebbe i compiti.
xpda,

3
Per avere un'idea iniziale delle risposte, considera la frazione della popolazione che non è correlata a un dato antenato per discesa. Inizialmente per una popolazione di . Con il missaggio casuale, viene quadrato dopo ogni generazione. In una popolazione iniziale di , diciamo, ciò implica che è quasi sicuramente dopo generazioni (circa - anni). ff=(n1)/nnfn=108f032600800
whuber

1
Credo che ci siano alcune ricerche accademiche sulla probabilità che un cognome unico si estingua. Sebbene non identico al problema posto, ciò potrebbe fornire alcune intuizioni interessanti (ma sfortunatamente non ricordo da dove provenga). Stranamente, credo che quegli studi abbiano portato ad alcune intuizioni in matematica dietro la diffusione della malattia infettiva ...
Michael McGowan,

Risposte:


13

Poiché questa domanda sta ricevendo risposte che variano da astronomicamente piccole a quasi il 100%, vorrei offrire una simulazione che serva da riferimento e ispirazione per soluzioni migliorate.

Chiamo questi "diagrammi di fiamma". Ognuno documenta la dispersione del materiale genetico all'interno di una popolazione mentre si riproduce in generazioni discrete. Le trame sono matrici di sottili segmenti verticali che raffigurano persone. Ogni riga rappresenta una generazione, con quella iniziale in alto. I discendenti di ogni generazione sono nella fila immediatamente sotto di essa.

All'inizio, solo una persona in una popolazione di taglia è contrassegnata e viene rappresentata in rosso. (È difficile da vedere, ma sono sempre tracciati a destra della riga superiore.) Anche i loro discendenti diretti sono disegnati in rosso; si presenteranno in posizioni completamente casuali. Gli altri discendenti sono stampati in bianco. Poiché le dimensioni della popolazione possono variare da una generazione all'altra, un bordo grigio a destra viene utilizzato per riempire lo spazio vuoto.n

Ecco un array di 20 risultati di simulazione indipendenti.

Diagrammi di fiamma

Il materiale genetico rosso alla fine si estinse in nove di queste simulazioni, lasciando i sopravvissuti nelle restanti 11 (55%). (In uno scenario, in basso a sinistra, sembra che l'intera popolazione alla fine si sia estinta.) Ovunque vi fossero sopravvissuti, tuttavia, quasi tutta la popolazione conteneva il materiale genetico rosso. Ciò fornisce la prova che la probabilità che un individuo selezionato casualmente dall'ultima generazione contenente il gene rosso è circa del 50%.

La simulazione funziona determinando casualmente una sopravvivenza e un tasso di natalità medio all'inizio di ogni generazione. La sopravvivenza è tratta da una distribuzione Beta (6,2): ha una media del 75%. Questo numero riflette sia la mortalità prima dell'età adulta sia quelle persone che non hanno figli. Il tasso di natalità è tratto da una distribuzione Gamma (2.8, 1), quindi ha una media di 2.8. Il risultato è una storia brutale di insufficiente capacità riproduttiva per compensare la mortalità generalmente elevata. Rappresenta un modello estremamente pessimista, nel peggiore dei casi - ma (come ho suggerito nei commenti) la capacità della popolazione di crescere non è essenziale. Tutto ciò che conta in ogni generazione è la proporzione di rosso all'interno della popolazione.

Per modellare la riproduzione, l'attuale popolazione viene ridotta ai sopravvissuti prelevando un semplice campione casuale della dimensione desiderata. Questi sopravvissuti vengono accoppiati in modo casuale (qualsiasi sopravvissuto dispari rimasto dopo l'accoppiamento non riesce a riprodursi). Ogni coppia produce un certo numero di bambini estratti da una distribuzione di Poisson la cui media è il tasso di natalità della generazione. Se uno dei genitori contiene il marcatore rosso, tutti i bambini lo ereditano: questo modella l'idea di discesa diretta attraverso entrambi i genitori.

Questo esempio inizia con una popolazione di 512 ed esegue la simulazione per 11 generazioni (12 righe incluso l'inizio). Le variazioni di questa simulazione che iniziano con un minimo di e fino a persone, utilizzando diverse quantità di sopravvivenza e tassi di natalità, presentano tutte caratteristiche simili: entro la fine di generazioni ( nove in questo caso), c'è circa 1/3 di probabilità che tutto il rosso sia scomparso, ma se non lo è, allora la maggior parte della popolazione è rossa. Entro altre due o tre generazioni, quasi tutta la popolazione è rossa e rimarrà rossa (altrimenti la popolazione si estinguerà del tutto).n=8214=16,384log2(n)

A proposito, una sopravvivenza del 75% o meno in una generazione non è fantasiosa. Alla fine del 1347 i topi infestati dalla peste bubbonica si diressero dapprima dall'Asia all'Europa; nei prossimi tre anni, tra il 10% e il 50% della popolazione europea è morto di conseguenza. La peste si ripresentò quasi una generazione dopo centinaia di anni (ma di solito non con la stessa mortalità estrema).


Codice

La simulazione è stata creata con Mathematica 8:

randomPairs[s_List] := Partition[s[[Ordering[RandomReal[{0, 1}, Length[s]]]]], 2];

next[s_List, survive_, nKids_] := Flatten[ConstantArray[Max[#], 
   RandomVariate[PoissonDistribution[nKids]]] & /@ 
   randomPairs[RandomSample[s, Ceiling[survive Length[s]]]]] 

Partition[Table[
   With[{n = 6}, ArrayPlot[NestList[next[#, RandomVariate[BetaDistribution[6, 2]], 
        RandomVariate[GammaDistribution[3.2, 1]]] &, 
        Join[ConstantArray[0, 2^n - 1], ConstantArray[1, 1]], n + 2], 
     AspectRatio -> 2^(n/3)/(2 n), 
     ColorRules -> {1 -> RGBColor[.6, .1, .1]},  
     Background -> RGBColor[.9, .9, .9]]
    ], {i, 1, 20}
   ], 4] // TableForm

1
Penso che modellare in questo modo possa essere l'approccio migliore. È molto più semplice e più divertente (per me) della matematica, e dovrebbe rendere molto più semplice introdurre fattori che limitano la selezione dei compagni. Hai consigli, avvertenze o altri consigli prima di approfondire questo?
xpda,

3
@xpda Le soluzioni matematiche forniranno informazioni su ciò che conta e cosa no. Ad esempio, mostreranno che non è necessario modellare popolazioni enormi. Indicheranno anche il ruolo svolto dalla variabilità, che è più difficile da gestire analiticamente e viene alla ribalta in una simulazione.
whuber

1
@whuber Hai eseguito la simulazione in Mathematica? Ti dispiacerebbe pubblicare codice?
assunto normale il

1
@Max Il codice è ora attivo. Mi scuso per la mancanza di commenti. Se si esegue ciascuno dei dati di test randomPairse nextsu di essi, le loro funzioni dovrebbero diventare evidenti. Notare l'uso di NestListiterare nextper produrre più generazioni.
whuber

3

Cosa succede quando provi a contare gli antenati?

n2n2528

Questo è il campo da baseball giusto, ma c'è qualcosa di sbagliato in questo calcolo, perché la popolazione della Terra nel 1300 non si mescolava in modo uniforme e stiamo ignorando i matrimoni misti all'interno del tuo "albero" ancestrale, vale a dire che stiamo contando due volte alcuni antenati.

228


2
Molto significativo considerando che gran parte della popolazione di allora era piuttosto isolata l'una dall'altra, quindi c'erano molte meno possibilità di evitare i matrimoni misti.
dcl,

2
Supponiamo quindi che l'OP sia di origine inglese e intorno al 1300 la popolazione inglese fosse oltre un milione. (Diciamo prima della grande carestia). Come cambierebbe la tua analisi?
Dassouki,

228268

228/34

2

Più vai indietro, più è probabile che tu sia imparentato con una persona che ha superato con successo i suoi geni che vivevano in quel periodo. Dei 1/4 miliardi di antenati che hai vissuto nel 1300, molti di loro sarebbero apparsi centinaia (se non migliaia, milioni) di volte nel tuo albero genealogico. La deriva genetica e il numero di volte in cui siamo direttamente collegati a qualcuno sono probabilmente più rilevanti per le differenze nel nostro codice genetico rispetto a chi erano i nostri antenati.


0

La probabilità è = 1-z, ogni discendente in questo problema è legato agli antenati sopra. Qualunque sia il tasso iniziale di riproduzione (1-z) è la tua probabilità di essere discendente da qualcuno nella popolazione iniziale. La probabilità solo incerta è quali sono le probabilità di essere vivi nella popolazione finale.

Sono d'accordo con la risposta di Erad, anche se ora penso che risponda a una domanda che non è stata posta, vale a dire qual è la probabilità che tu sia vivo a causa di alcuni noti vincoli riproduttivi e di popolazione sui tuoi antenati.


n1zzg

Inoltre, per chiarire, la domanda è trovare la probabilità che una determinata persona nella generazione finale discenda da una determinata persona nella generazione iniziale.
xpda,

1
AAAA

Il cogito di @Wipa Descartes , ergo sum suggerisce fortemente che la probabilità che io sia vivo dato che qualsiasi vincolo sui miei antenati è del 100% :-)
whuber

@whuber, hai ragione. Credo che stiamo parlando dello stesso problema. La cosa che volevo chiarire è che non sto cercando la probabilità che qualcuno nella prima generazione abbia un discendente vivo nell'ultima generazione. Avevo paura che fosse lì che Wipa trovò (1-z) la risposta.
xpda,

0

p>(1z)×1n1(1z)2=2n1

Risposta spiegata:
data una persona in particolare oggi, è certo che discendono da almeno 2 persone nel 1300.

Quando si sceglie una persona in particolare nel 1300, ci sono (1-z) possibilità che quella persona non si sia mai riprodotta, e l'altro termine indica il numero di "coppie di genitori" e la probabilità che la persona sia collegata a questa coppia (1 / numero di coppie).

p>2n1


nk+1=nk(1z)×c2=n1(1z)kck2k







p>2/360,000,000=5.56×109

Grazie per la lettura, Erad


cz

Sulla base della domanda originale sopra: c = il numero medio di figli per coppia e z = la percentuale di persone che non hanno figli
Erad

2
1/n1/360M109

3
360,000,000/(2.66×10249)1

1
108

0

Questa è una domanda molto interessante in quanto ci sta chiedendo di risolvere matematicamente un frattale. Come il famoso gioco della vita .

p1=2n1limkpk=(1z)

pkk

p1=2n1

p2=relatives×2n2+non.relatives×4n2
relatives=(c2)×nc(n2)=c1n1
p3=immediate.relatives×4n3+cousins×6n3+non.relatives×8n3

Con ogni generazione, la probabilità di essere correlata a qualcuno nella popolazione iniziale aumenterà senza dubbio, ma a un ritmo decrescente. Questo perché aumenterà la probabilità di attirare "parenti" che provengono dallo stesso o simile albero.

Usiamo l'etnia come esempio. Diciamo che sappiamo per certo che qualcuno è caucasico al 100%. Alla generazione 28 è molto probabilmente correlato a una porzione significativa della popolazione caucasica nel 1300 (come mostrato dalla simulazione @whuber). Diciamo che sta sposando qualcuno che è al 100% di etnia diversa. La loro progenie sarà collegata a circa il doppio del numero di persone a cui sono collegate dal 1300.

Un altro pensiero interessante è che, data la razza umana (homosapien) iniziata da circa 600 persone in Africa, allora molto probabilmente siamo una permutazione genetica di tutti coloro che si sono accoppiati con successo.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.