Numero atteso di rapporto tra nascita di ragazze e ragazzi


45

Mi sono imbattuto in una domanda nel test attitudinale del colloquio di lavoro per il pensiero critico. Va qualcosa del genere:

La Repubblica di Zorgan ha alcuni costumi molto strani. Le coppie desiderano solo avere figli femmine poiché solo le femmine possono ereditare la ricchezza della famiglia, quindi se hanno un figlio maschio continuano ad avere più figli fino a quando non hanno una femmina. Se hanno una ragazza, smettono di avere figli. Qual è il rapporto tra ragazze e ragazzi a Zorgania?

Non sono d'accordo con la risposta del modello fornita dall'autore della domanda, che è di circa 1: 1. La giustificazione era che ogni parto avrà sempre una probabilità del 50% di essere maschio o femmina.

Puoi convincermi con una risposta più matematica e vigorosa di E[sol]:E[B] se sol è il numero di ragazze e B è il numero di ragazzi nel paese?


3
Sei corretto nel tuo disaccordo con la risposta del modello perché il rapporto M: F delle nascite è diverso dal rapporto M: F dei bambini. Nelle società umane reali, le coppie che desiderano avere figli femmine ricorrono probabilmente a mezzi come l'infanticidio o l'adozione straniera per sbarazzarsi dei figli maschi, con un rapporto M: F inferiore a 1: 1.
Gabe,

10
@Gabe Non si fa menzione di infanticidio nella domanda, si tratta di un esercizio matematico in contrasto con un'analisi grintosa di un paese reale in cui l'omicidio è un luogo comune. Allo stesso modo il rapporto reale delle nascite tra maschi e femmine è più vicino alle 51:49 (ignorando i fattori sociali)
Richard Tingle

2
Grazie alle risposte ora capisco perché il rapporto sarebbe 1: 1, che in origine suona per me intuitivo. Uno dei motivi della mia incredulità e confusione è che, so che i villaggi in Cina hanno i problemi opposti di un ragazzo troppo alto: il rapporto tra ragazze. Vedo realisticamente che le coppie non saranno in grado di continuare a procreare indefinitamente fino a quando non ottengono il genere di bambino che desiderano. In Cina la legge prevede solo 2 bambini al massimo per le persone che vivono nelle aree rurali, quindi in questo caso il rapporto sarà più vicino a 3: 2 che a 1: 1.
Mobius Pizza

4
@MobiusPizza: No, il rapporto è 1: 1, non importa quanti figli hai! Il motivo per cui la Cina ha un rapporto diverso è dovuto a fattori sociali come l'infanticidio, l'aborto selettivo per sesso e l'adozione straniera.
Gabe,

3
Le simulazioni @newmount sono buone, ma significano tanto quanto le ipotesi incorporate in esse. La visualizzazione del solo codice, senza alcuna spiegazione, rende difficile per le persone identificare tali ipotesi. In assenza di tali giustificazioni e spiegazioni, nessuna quantità di output di simulazione affronterà qui la domanda. Per quanto riguarda il "mondo reale", chiunque sostenga tale affermazione dovrà supportarlo con dati sulle nascite umane.
whuber

Risposte:


46

Inizia senza figli

ripetere il passaggio

{

Ogni coppia che ha ancora figli ha un figlio. Metà delle coppie ha maschi e metà delle coppie ha femmine.

Quelle coppie che hanno femmine smettono di avere figli

}

Ad ogni passaggio ottieni un numero pari di maschi e femmine e il numero di coppie che hanno figli si riduce della metà (vale a dire quelli che hanno avuto femmine non avranno figli nel passaggio successivo)

Quindi, in qualsiasi momento hai un uguale numero di maschi e femmine e di passaggio in passo il numero di coppie che hanno figli diminuisce della metà. Man mano che vengono create più coppie, si ripresenta la stessa situazione e tutte le altre cose sono uguali, la popolazione conterrà lo stesso numero di maschi e femmine


6
Penso che questo sia un modo eccellente per spiegare la distribuzione delle probabilità senza fare affidamento su una rigorosa prova matematica.
LBushkin,

1
Quello che mi piace è che questo spiega anche cosa è successo alle ragazze in eccesso che il tuo intuito si aspetta: le ragazze in eccesso sono desiderate dai genitori (sono i genitori che ci riprovano), ma quei genitori (nel complesso) non creano mai con successo un eccesso di ragazze.
Ben Jackson,

2
Puoi semplificare ulteriormente dicendo "ripeti il ​​passaggio {qualcuno decide se avere o meno un figlio}". Le regole secondo le quali decidono sono completamente irrilevanti a condizione che tutti producano ragazzi e ragazze indipendentemente con la stessa probabilità. Non è nemmeno necessario assumere un valore per quella probabilità, si potrebbe semplicemente dire che la frequenza nella popolazione sarà la stessa della frequenza alla nascita.
Steve Jessop,

1
@martino Non credo che sia così, anche se non sarei sorpreso se ci fosse una matematica molto convincente in questo senso. Credo che questo scenario porti a una rottura della nostra nozione di rapporti, perché il numero atteso di figli per famiglia è infinito. Dovresti essere scettico sulla tua risposta a causa della generalità con cui le persone hanno risposto alla tua domanda in questo thread.
Jlimahaverford,

1
@ martino. Per divertimento ho appena eseguito una simulazione con quel criterio di arresto. 10.000 famiglie avevano un totale di 160.693.469 ragazzi (e quel numero più 10.000 altre ragazze) per un rapporto di 0.9999377735896915. Roba abbastanza incredibile.
Jlimahaverford,

37

Lascia che sia il numero di ragazzi in una famiglia. Non appena hanno una ragazza, si fermano, quindiX

X=0se il primo figlio fosse una ragazzaX=1se il primo figlio era un ragazzo e il secondo era una ragazzaX=2se i primi due figli erano maschi e il terzo era femminae così via...

Se è la probabilità che un bambino sia un ragazzo e se i sessi sono indipendenti tra i bambini, la probabilità che una famiglia finisca per avere k ragazzi è P ( X = k ) = p k( 1 - p ) , cioè la probabilità di avere k ragazzi e poi avere una ragazza. Il numero atteso di ragazzi è E X = k = 0 k p k( 1 - p ) =pK

P(X=K)=pK(1-p),
K Notando che k = 0 kpk= k = 0 (k+1)pk+1otteniamo k = 0 kpk- k = 0 k
EX=ΣK=0KpK(1-p)=ΣK=0KpK-ΣK=0KpK+1.
ΣK=0KpK=ΣK=0(K+1)pK+1
dove abbiamo usatok = 0 pk=1/(1-p)quando0<p<1(vediserie geometriche).
ΣK=0KpK-ΣK=0KpK+1=ΣK=0(K+1)pK+1-ΣK=0KpK+1=ΣK=0pK+1=pΣK=0pK=p1-p
ΣK=0pK=1/(1-p)0<p<1

Se , abbiamo che E X = 0.5 / 0.5 . Cioè, la famiglia media ha 1 figlio. Sappiamo già che tutte le famiglie hanno 1 ragazza, in modo che il rapporto sarà nel tempo anche per essere 1 / 1 = 1 .p=1/2EX=0.5/0.51/1=1

La variabile casuale è nota come variabile casuale geometrica .X


4
Questo, ovviamente, presuppone che psia lo stesso per tutte le famiglie. Se invece ipotizziamo che alcune coppie hanno maggiori probabilità di avere figli rispetto ad altre ( cioè , pè più alta), il risultato cambia, anche se il valore medio di pè ancora 0,5. (Comunque, questa è un'ottima spiegazione delle statistiche di base sottostanti.)
Ben Hocking,

2
@Ben Il tuo commento contiene un'idea chiave. La stessa cosa mi era venuta in mente, quindi ho modificato la mia domanda per includere un'analisi di questa situazione più realistica. Mostra che il rapporto di limitazione non è necessariamente 1: 1.
whuber

1
@BenHocking Infatti! E come sappiamo da entrambe le statistiche moderne e classica analisi di Laplace di rapporti di nascita, non è proprio uguale a 1 / 2 in ogni caso. :)p1/2
MånsT

21

Sommario

Il semplice modello secondo cui tutte le nascite hanno indipendentemente il 50% di possibilità di essere ragazze è irrealistico e, a quanto pare, eccezionale. Non appena consideriamo le conseguenze della variazione dei risultati tra la popolazione, la risposta è che il rapporto ragazza: ragazzo può essere qualsiasi valore non superiore a 1: 1. (In realtà probabilmente sarebbe ancora vicino a 1: 1, ma è una questione che deve essere determinata dall'analisi dei dati.)

Poiché queste due risposte contrastanti sono entrambe ottenute assumendo l'indipendenza statistica dei risultati di nascita, un appello all'indipendenza non è una spiegazione sufficiente. Sembra quindi che la variazione (nelle possibilità di nascite femminili) sia l'idea chiave alla base del paradosso.

introduzione

Un paradosso si verifica quando pensiamo di avere buone ragioni per credere a qualcosa, ma siamo confrontati con un argomento dall'aspetto solido al contrario.

Una soluzione soddisfacente a un paradosso ci aiuta a capire sia ciò che era giusto sia ciò che potrebbe essere stato sbagliato in entrambi gli argomenti. Come spesso accade nella probabilità e nelle statistiche, entrambi gli argomenti possono effettivamente essere validi: la risoluzione dipenderà dalle differenze tra ipotesi che sono implicitamente fatte. Il confronto di questi diversi presupposti può aiutarci a identificare quali aspetti della situazione portano a risposte diverse. Individuare questi aspetti, sostengo, è ciò che dovremmo valutare di più.

ipotesi

Come evidenziato da tutte le risposte inviate finora, è naturale supporre che nascite femminili verificano indipendente e con probabilità costante di . È noto che nessuno dei due presupposti è in realtà vero, ma sembrerebbe che lievi deviazioni da questi presupposti non dovrebbero influenzare molto la risposta. Lasciaci vedere. A tal fine, considera il seguente modello più generale e più realistico:1/2

  1. In ogni famiglia la probabilità di una nascita femminile è una costante p i , indipendentemente dall'ordine di nascita.iopio

  2. In assenza di una regola di arresto, il numero previsto di nascite femminili nella popolazione dovrebbe essere vicino al numero previsto di nascite maschili.

  3. Tutti i risultati di nascita sono (statisticamente) indipendenti.

Questo non è ancora un modello completamente realistica delle nascite umane, in cui il può variare con l'età dei genitori (in particolare la madre). Tuttavia, è sufficientemente realistico e flessibile fornire una risoluzione soddisfacente del paradosso che si applicherà anche a modelli più generali.pio

Analisi

Sebbene sia interessante condurre un'analisi approfondita di questo modello, i punti principali diventano evidenti anche quando viene considerata una versione specifica, semplice (ma un po 'estrema). Supponiamo che la popolazione abbia famiglie N. In metà di questi la possibilità di una nascita femminile è 2 / 3 e l'altra metà la probabilità di una nascita femminile è 1 / 3 . Ciò soddisfa chiaramente la condizione (2): il numero previsto di nascite maschili e femminili è lo stesso.2N2/31/3

Considera quelle prime famiglie. Cerchiamo di ragionare in termini di aspettative, comprendendo che i risultati effettivi saranno casuali e quindi varieranno leggermente dalle aspettative. (L'idea alla base della seguente analisi è stata trasmessa più brevemente e semplicemente nella risposta originale che appare alla fine di questo post.)N

Sia il numero previsto di nascite femminili in una popolazione di N con probabilità di nascita femminile costante p . Ovviamente questo è proporzionale a N e così può essere scritto f ( N , p ) = f ( p ) N . Allo stesso modo, sia m ( p ) N il numero previsto di nascite maschili.f(N,p)NpNf(N,p)=f(p)Nm(p)N

  • Il primo famiglie producono una ragazza e di arresto. Le altre ( 1 - p ) famiglie N producono un ragazzo e continuano a generare figli. Finora sono p N ragazze e ( 1 - p ) N ragazzi.pN(1-p)NpN(1-p)N

  • Le restanti famiglie N si trovano nella stessa posizione di prima:(1-p)N l'assunto di indipendenza (3) implica che ciò che sperimenteranno in futuro non è influenzato dal fatto che il loro primogenito fosse un figlio. Pertanto, queste famiglie produrranno più ragazze e m ( p ) [ ( 1 - p ) N ] più ragazzi.f(p)[(1-p)N]m(p)[(1p)N]

Sommando le ragazze totali e i ragazzi totali e confrontandoli con i valori assunti di e m ( p ) N si ottengono equazionif(p)Nm(p)N

f(p)N=pN+f(p)(1p)N  and  m(p)N=(1p)N+m(p)(1p)N

con soluzioni

f(p)=1  and  m(p)=1p1.

Il numero previsto di ragazze nelle prime famiglie, con p = 2 / 3 , è quindi f ( 2 / 3 ) N = N e il numero atteso di ragazzi è m ( 2 / 3 ) N = N / 2 .Np=2/3f(2/3)N=Nm(2/3)N=N/2

Np=1/3f(1/3)N=Nm(1/3)N=2N

(1+1)N=2N(1/2+2)N=(5/2)NN

E(# ragazze# ragazzi)2N(5/2)N=45.

La regola di arresto favorisce i ragazzi!

p1-pN

2p(1-p)1-2p(1-p).

p010111p=1/2

Risoluzione

Se il tuo intuito è che fermarsi con la prima ragazza dovrebbe produrre più ragazzi nella popolazione, quindi hai ragione, come mostra questo esempio. Per essere corretti, tutto ciò che serve è che la probabilità di dare alla luce una ragazza varia (anche solo di poco) tra le famiglie.

La risposta "ufficiale", secondo cui il rapporto dovrebbe essere vicino a 1: 1, richiede diverse ipotesi non realistiche ed è sensibile a esse: suppone che non ci possano essere variazioni tra le famiglie e che tutte le nascite debbano essere indipendenti.

Commenti

L'idea chiave evidenziata da questa analisi è che la variazione all'interno della popolazione ha conseguenze importanti. L'indipendenza delle nascite - sebbene sia un'ipotesi semplificativa utilizzata per ogni analisi in questo thread - non risolve il paradosso, perché (a seconda delle altre ipotesi) è coerente sia con la risposta ufficiale che con il suo contrario.

piopiopio

Se sostituiamo il genere con un'altra espressione genetica, otteniamo una semplice spiegazione statistica della selezione naturale : una regola che limita in modo differenziale il numero di prole in base alla loro composizione genetica può alterare sistematicamente le proporzioni di quei geni nella generazione successiva. Quando il gene non è legato al sesso, anche un piccolo effetto verrà propagato in modo moltiplicativo attraverso le generazioni successive e potrà rapidamente ingrandirsi notevolmente.


Risposta originale

Ogni bambino ha un ordine di nascita: primogenito, secondogenito e così via.

Supponendo pari probabilità di nascite maschili e femminili e nessuna correlazione tra i sessi, la Legge debole dei grandi numeri afferma che ci sarà un rapporto 1: 1 tra femmine primogenite e maschi. Per lo stesso motivo ci sarà un rapporto 1: 1 tra femmine nate secondarie e maschi, e così via. Poiché questi rapporti sono costantemente 1: 1, anche il rapporto complessivo deve essere 1: 1, indipendentemente da quali siano le frequenze relative degli ordini di nascita nella popolazione.


Interessante; questo sembra essere perché, sebbene nessuna regola possa cambiare il rapporto dal rapporto naturale, può cambiare il numero di bambini risultanti e quel numero di bambini dipende dal rapporto naturale. Quindi nel tuo esempio hai due popolazioni di genitori che sono influenzate in modo diverso. (Detto questo, sembra una situazione al di fuori dell'ambito del paese immaginario implicito, che è più un esercizio matematico)
Richard Tingle,

pio1/21

1
né dovresti scusarti, questo è un risultato molto interessante (pensavo davvero wow quando l'ho letto). Lo preferirei semplicemente nella forma "Risultato originale", "Situazione più realistica". Il modo in cui è scritto sembra barare (il che è ingiusto perché, come dico, è molto interessante) perché potrei dire altrettanto facilmente "Beh, ovviamente non è 1: 1 perché le nascite maschili sono più comuni" (credo a causa delle nostre locazioni storiche morire in un conflitto armato)
Richard Tingle,

pio0.51

@whuber Grazie per la risposta informativa. Non capisco perché nel tuo calcolo hai diviso la popolazione in 2 famiglie con diverse probabilità di dare alla luce ragazze. Secondo il punto 1 della tua ipotesi modello, il p_i dovrebbe essere lo stesso per tutte le famiglie. Quindi, perché hai diviso la popolazione in 2 tipi di famiglie?
Mobius Pizza,

14

La nascita di ogni bambino è un evento indipendente con P = 0,5 per un ragazzo e P = 0,5 per una ragazza. Gli altri dettagli (come le decisioni familiari) ti distraggono solo da questo fatto. La risposta, quindi, è che il rapporto è 1: 1 .

Per spiegarlo: immagina che invece di avere figli, stai lanciando una moneta giusta (P (teste) = 0,5) fino a ottenere una "testa". Diciamo che la Famiglia A lancia la moneta e ottiene la sequenza di [code, code, teste]. Quindi la famiglia B lancia la moneta e ottiene una croce. Ora, qual è la probabilità che il prossimo sarà diretto? Ancora 0,5 , perché è questo che significa indipendente . Se dovessi farlo con 1000 famiglie (il che significa che sono arrivate 1000 teste), il numero totale previsto di code è 1000, perché ogni lancio (evento) era completamente indipendente.

Alcune cose non sono indipendenti, come la sequenza all'interno di una famiglia: la probabilità della sequenza [teste, teste] è 0, non uguale a [code, code] (0,25). Ma dal momento che la domanda non si pone al riguardo, è irrilevante.


3
Come detto, questo non è corretto. Se i sessi fossero incondizionatamente indipendenti, a lungo termine ci sarebbero tante sequenze di ragazze e ragazze nelle nascite tra le famiglie quante sono le sequenze ragazzo-ragazzo. Ci sono molti di questi ultimi e mai nessuno dei primi. Esiste una forma di indipendenza, ma è subordinata all'ordine di nascita.
whuber

1
@whuber Non ci viene chiesto quante sequenze ragazza-ragazza ci siano. Solo il rapporto tra ragazze e ragazzi. Non ho affermato che la sequenza di nascite di una singola madre è una serie di eventi indipendenti, come il lancio di monete. Solo che ogni nascita, individualmente, è un evento indipendente.
Tim S.

Dovrai essere molto più chiaro al riguardo. Ho citato le sequenze per dimostrare la mancanza di indipendenza, quindi l'onere è per te dichiarare esattamente in che senso rigoroso "indipendenza" si applica qui.
whuber

@whuber Gli eventi sono indipendenti come le lancette di monete. Ho spiegato questo nella mia risposta.
Tim S.

3
@whuber le sequenze ragazza-ragazza si presentano se metti tutte le nascite in fila; dopo che una coppia finisce la prossima, ecc. ecc.
Richard Tingle,

6

Immagina di lanciare una moneta giusta finché non osservi una testa. Quante code lanci?

P(0 code)=12,P(1 coda)=(12)2,P(2 code)=(12)3,...

Il numero previsto di code può essere facilmente calcolato * pari a 1.

Il numero di teste è sempre 1.

* se questo non ti è chiaro, vedi 'schema di prova' qui


6

Le coppie con esattamente una ragazza e nessun ragazzo sono le più comuni

Il motivo per cui tutto questo funziona è perché la probabilità di uno scenario in cui ci sono più ragazze è molto più grande degli scenari in cui ci sono più ragazzi. E gli scenari in cui ci sono molti più ragazzi hanno probabilità molto basse. Il modo specifico in cui si risolve è illustrato di seguito

NumberOfChilden Probability  Girls   Boys  
1               0.5           1       0  
2               0.25          1       1  
3               0.125         1       2  
4               0.0625        1       3  
...             ...           ...     ...  

NumberOfChilden Probability   Girls*probabilty   Boys*probabilty 
1               0.5           0.5                0
2               0.25          0.25               0.25
3               0.125         0.125              0.25
4               0.0625        0.0625             0.1875
5               0.03125       0.03125            0.125
...             ...           ...                ...  
n               1/2^n         1/(2^n)            (n-1)/(2^n)

Puoi praticamente vedere dove sta andando a questo punto, il totale delle ragazze e dei ragazzi si sommerà a uno.

Ragazze attese da una coppia=Σn=1(12n)=1
=Σn=1(n-1n2)=1

Limitare le soluzioni di wolfram

Ogni nascita, qualunque sia la famiglia, ha una probabilità 50:50 di essere un maschio o una femmina

Tutto ciò ha un senso intrinseco perché (prova come potrebbero fare le coppie) non puoi controllare la probabilità che un parto specifico sia un maschio o una femmina. Non importa se un bambino nasce da una coppia senza figli o da una famiglia di cento ragazzi; la possibilità è 50:50, quindi se ogni singola nascita ha una probabilità 50:50, dovresti sempre avere metà maschi e metà femmine. E non importa come mescoli le nascite tra le famiglie; non influenzerai questo.

Funziona con 1 regola qualsiasi

Perché a causa della probabilità 50:50 per qualsiasi nascita, il rapporto finirà come 1: 1 per qualsiasi (ragionevole 1 ) regola che puoi trovare. Ad esempio, anche la seguente regola analoga funziona

Le coppie smettono di avere figli quando hanno una ragazza o due figli

NumberOfChilden Probability   Girls   Boys
1               0.5           1       0
2               0.25          1       1
2               0.25          0       2

In questo caso il totale dei bambini previsti viene calcolato più facilmente

Ragazze attese da una coppia=0.51+0.251=0.75
Ragazzi attesi da una coppia=0.251+0.252=0.75

1 Come ho detto, questo funziona per qualsiasi regola ragionevole che potrebbe esistere nel mondo reale. Una regola irragionevole sarebbe quella in cui i figli previsti per coppia erano infiniti. Ad esempio "I genitori smettono di avere figli solo quando hanno il doppio dei ragazzi rispetto alle ragazze", possiamo usare le stesse tecniche di cui sopra per mostrare che questa regola dà infiniti bambini:

NumberOfChilden Probability   Girls   Boys
3               0.125         1       2
6               1/64          2       4
9               1/512         3       6
3*m             1/((3m)^2     m       2m

Possiamo quindi trovare il numero di genitori con un numero finito di figli

Numero previsto di genitori con figli finiti=Σm=1(11/(3m)2)=π254=0,18,277 mila....

Limitare le soluzioni di wolfram

Quindi da ciò possiamo stabilire che l'82% dei genitori avrebbe un numero infinito di figli; da un punto di vista urbanistico ciò probabilmente causerebbe difficoltà e dimostra che questa condizione non potrebbe esistere nel mondo reale.


3
Il fatto che le nascite non siano indipendenti è evidente esaminando le sequenze di nascite: la sequenza ragazza-ragazza non appare mai mentre le sequenze ragazzo-ragazzo si verificano spesso.
whuber

1
@whuber Vedo il tuo punto (anche se probabilmente è la decisione di avere un figlio a tutto ciò che dipende, piuttosto che il risultato dell'evento stesso) forse sarebbe meglio dire "la probabilità di una nascita futura di essere un ragazzo è indipendente da tutte le nascite passate "
Richard Tingle,

Sì, penso che ci sia un modo per salvare l'uso dell'indipendenza qui. Ma questo porta - credo - al centro della questione, quindi sembra che per onorare la richiesta del PO di una dimostrazione "vigorosa" (rigorosa?) Sia necessario un ragionamento accurato su questo problema.
whuber

@whuber Ad essere onesti, il primo paragrafo è un po 'ondulato, gli altri paragrafi (e in particolare i limiti) dovrebbero essere il pezzo rigoroso
Richard Tingle,

Nessun argomento lì - ma quest'ultimo materiale è già stato trattato allo stesso modo nelle risposte a stats.stackexchange.com/a/93833 , stats.stackexchange.com/a/93835 e stats.stackexchange.com/a/93841 .
whuber

5

Puoi anche usare la simulazione:

p<-0
for (i in 1:10000){
  a<-0
  while(a != 1){   #Stops when having a girl
    a<-as.numeric(rbinom(1, 1, 0.5))   #Simulation of a new birth with probability 0.5
    p=p+1   #Number of births
  }
}
(p-10000)/10000   #Ratio

1
I risultati della simulazione sono buoni in quanto possono darci conforto che non abbiamo commesso un grave errore in una derivazione matematica, ma sono ben lontani dalla rigorosa dimostrazione richiesta. In particolare, quando possono verificarsi eventi rari che contribuiscono molto ad un'aspettativa (come una famiglia con 20 ragazzi prima che appaia una ragazza - che è altamente improbabile che emergano in una simulazione di sole 10.000 famiglie), allora le simulazioni possono essere instabili o anche solo sbagliato, non importa per quanto tempo vengono ripetuti.
whuber

Riconoscere la distribuzione geometrica del numero di ragazzi in famiglia è il passaggio chiave a questo problema. Prova:mean(rgeom(10000, 0.5))
AdamO

5

La mappatura di questo mi ha aiutato a vedere meglio come il rapporto tra la popolazione alla nascita (presumibilmente 1: 1) e il rapporto tra la popolazione dei bambini sarebbe entrambi 1: 1. Mentre alcune famiglie avrebbero più ragazzi ma solo una ragazza, il che inizialmente mi ha portato a pensare che ci sarebbero stati più ragazzi che ragazze, il numero di quelle famiglie non sarebbe superiore al 50% e diminuirebbe della metà con ogni bambino aggiuntivo, mentre il il numero di famiglie con una sola ragazza sarebbe del 50%. Il numero di ragazzi e ragazze si bilancerebbe così a vicenda. Vedi i totali di 175 in fondo. Rapporto bambini


2

Quello che hai ottenuto è stata la risposta più semplice e corretta. Se la probabilità che un neonato sia un maschio è p, e i bambini del genere sbagliato non sono accolti da incidenti sfortunati, non importa se i genitori prendono decisioni sull'avere più figli in base al sesso del bambino. Se il numero di bambini è N e N è grande, puoi aspettarti dei ragazzi p * N. Non è necessario un calcolo più complicato.

Vi sono certamente altre domande, come "qual è la probabilità che il figlio minore di una famiglia con figli sia un maschio", o "qual è la probabilità che il figlio maggiore di una famiglia con figli sia un maschio". (Uno di questi ha una semplice risposta corretta, l'altro ha una semplice risposta sbagliata e ottenere una risposta corretta è difficile).


2

Permettere

Ω= {(G), (B, G), (B, B, G),...}

essere lo spazio campione e lasciare

X: ΩRω|ω|-1

ωEX)

E (X) =Σn=1(n-1)0.5n= 1

In sostanza, il valore atteso delle ragazze è 1. Quindi anche il rapporto è 1.


2

È una domanda trabocchetto. Il rapporto rimane lo stesso (1: 1). La risposta giusta è che non influisce sul rapporto di natalità, ma influisce sul numero di figli per famiglia con un fattore limitante di una media di 2 nascite per famiglia.

Questo è il tipo di domanda che potresti trovare in un test logico. La risposta non riguarda il rapporto di natalità. Questa è una distrazione.

Questa non è una domanda di probabilità, ma una domanda di ragionamento cognitivo. Anche se hai risposto al rapporto 1: 1, hai comunque fallito il test.


Di recente ho modificato la mia risposta per dimostrare che la soluzione non è necessariamente 1: 1, il che contrasta esplicitamente le tue affermazioni.
whuber

Ho letto la tua risposta. Hai introdotto un predicato che non è indicato nel problema (varianza nel tasso di natalità delle femmine). Non c'è nulla nel problema che asserisce che la Repubblica di Zorgan è rappresentativa della popolazione umana o persino degli umani.
Andrew - OpenGeoCode

1
Ciò è corretto, ma non c'è nulla di altrettanto valido che giustifica l'ipotesi semplificata che tutte le probabilità di nascita siano uguali. Le ipotesi devono essere fatte al fine di fornire una risposta obiettiva e difendibile, così come minimo una buona risposta sarà esplicita sulle ipotesi che fa e fornire supporto a tali ipotesi. Affermare che "questa non è una domanda di probabilità" non affronta i problemi, ma li trascura del tutto.
whuber

@whuber - Il rapporto di natalità in questo problema è invariante. La variante del problema è il numero di nascite per famiglia. La domanda è una distrazione, non fa parte del problema. <br/> Il pensiero laterale, è la capacità di pensare in modo creativo, o "fuori dagli schemi", come viene talvolta chiamato nel mondo degli affari, di usare l'ispirazione e l'immaginazione per risolvere i problemi osservandoli da prospettive inaspettate. Il pensiero laterale implica scartare l'ovvio, lasciarsi alle spalle i modi tradizionali di pensare e gettare via i preconcetti. [fyi> Sono uno scienziato principale in Lab]
Andrew - OpenGeoCode

1
Potresti, quindi, aver trascurato un punto chiave nella mia risposta: i suoi presupposti mantengono anche la probabilità media della popolazione di una femmina invariante alla nascita a 1: 1 (in un modo specifico che spero sia stato chiaramente descritto). Vorrei sostenere che vi è un sostanziale "pensiero laterale" coinvolto in qualsiasi risoluzione di un paradosso in cui le ipotesi sono esaminate criticamente: richiede immaginazione e buone capacità analitiche per vedere che si stanno facendo ipotesi in primo luogo. Respingere qualsiasi domanda come un semplice "trucco", come fai qui, sembrerebbe antitetico a promuovere o celebrare tale pensiero.
whuber

2

Sto mostrando il codice che ho scritto per una simulazione Monte Carlo (famiglie 500x1000) usando il software `MATLAB '. Esamina attentamente il codice in modo che non abbia commesso un errore.

Il risultato viene generato e tracciato di seguito. Mostra che la probabilità di nascita simulata della ragazza ha un ottimo accordo con la probabilità di nascita naturale sottostante indipendentemente dalla regola di arresto per un intervallo di probabilità di nascita naturale.

inserisci qui la descrizione dell'immagine

Giocando con il codice è più facile capire un punto che non ho mai fatto prima --- come altri sottolineano, la regola di arresto è una distrazione. La regola di arresto riguarda solo il numero di famiglie a cui è stata assegnata una popolazione fissa o, da un altro punto di vista, il numero di nascite di bambini dato un numero fisso di famiglie. Il genere è determinato esclusivamente dal lancio di dadi e quindi il rapporto o la probabilità (che è indipendente dal numero di bambini) dipenderà esclusivamente dal ragazzo naturale: la nascita della ragazza rato.

testRange=0.45:0.01:0.55;
N=uint32(100000); %Used to approximate probability distribution
M=1000; %Number of families
L=500; %Monte Carlo repetitions
Nfamily=zeros(length(testRange),1);
boys=zeros(length(testRange),1);
girls=zeros(length(testRange),1);
for l = 1:L
    j=1; %Index variable for the different bgratio
    for bgratio=testRange
    k=1; %Index variable for family in each run (temp family id)
    vec=zeros(N,1);
    vec(1:N*bgratio,1)=1; %Approximate boy:girl population for dice roll, 
    %1 = boy

    vec=vec(randperm(s,N)); %Random permutation, technically not necessary 
    %due to randi used later, just be safe
    bog = vec(randi(N)); %boy or girl? (God's dice roll)

    while k<M %For M families...
        if bog == 1 %if boy:
            boys(j) = boys(j)+1; %total global boys tally
        else
            girls(j)=girls(j)+1; %total global girls tally
            %Family stops bearing children
            Nfamily(j) = Nfamily(j)+1; %total global family tally
            k=k+1; %temp family id
            %Next family...
        end
        bog=vec(randi(N)); %Sample next gender (God's dice roll)
    end

    j=j+1; %Index variable for the different bgratio
    end
end
figure;
scatter(testRange,girls./(boys+girls))
hold on
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.44 0.56 0.44 0.56])

2

Lascia che la variabile casuale denoti il iothXio0.5 .

E[ΣioXio]=ΣioE[Xio]=0.5nn è il numero di bambini nel paese.)

E[Σio(1-Xio)]=ΣioE[1-Xio]=0.5n .

L'indipendenza delle nascite è irrilevante per il calcolo dei valori previsti.


La risposta di Apropos @ whuber, se c'è una variazione della probabilità marginale tra le famiglie, il rapporto si inclina verso i ragazzi, a causa del fatto che ci sono più bambini nelle famiglie con una maggiore probabilità di ragazzi rispetto alle famiglie con una probabilità inferiore, con un effetto aumentativo di la somma del valore atteso per i ragazzi.


2

Ho anche programmato indipendentemente una simulazione in MATLAB, prima di vedere cosa hanno fatto gli altri. A rigor di termini non è un MC perché eseguo l'esperimento solo una volta. Ma una volta è sufficiente per ottenere risultati. Ecco cosa produce la mia simulazione. Non prendo posizione sulla probabilità che le nascite siano p = 0,5 come primitive. Ho lasciato variare la probabilità di nascita in un intervallo di Pr (Ragazzi = 1) = 0,25: 0,05: 0,75.

I miei risultati mostrano che poiché la probabilità si discosta da p = 0,5, il rapporto tra i sessi è diverso da 1: in attesa il rapporto tra i sessi è semplicemente il rapporto tra la probabilità della nascita di un ragazzo e la probabilità della nascita di una ragazza. Cioè, questa è una variabile casuale geometrica identificata in precedenza da @ månst. Questo è ciò che credo che il poster originale fosse intuitivo.

I miei risultati imitano da vicino ciò che ha fatto il poster sopra con il codice matlab, abbinando i rapporti sessuali alle probabilità 0,45, 0,50 e 0,55 che un bambino è nato. Vi presento il mio mentre adotto un approccio leggermente diverso per ottenere i risultati con un codice più veloce. Per eseguire il confronto ho omesso la sezione di codice vec = vec (randperm (s, N)) poiché s non è definito nel loro codice e non conosco l'intenzione originale di questa variabile (anche questa sezione di codice sembra superflua - come originariamente ha dichiarato).

Pubblico il mio codice

clear all; rng('default')

prob_of_boy = 0.25:0.05:0.75;
prob_of_girls = 1 - prob_of_boy;

iterations = 200;

sex_ratio = zeros(length(prob_of_boy),1);
prob_of_girl_est = zeros(length(prob_of_boy),1);
rounds_of_reproduction = zeros(length(prob_of_boy),1);

for p=1:length(prob_of_boy)

    pop = 1000000;

    boys = zeros(iterations,1);
    girls = zeros(iterations,1);
    prob_of_girl = zeros(iterations,1);

    for i=1:iterations

        x = rand(pop,1);
        x(x<prob_of_boy(p))=1;

        %count the number of boys and girls
        num_boys = sum(x(x==1));

        boys(i) = num_boys;
        girls(i) = pop - num_boys;

        prob_of_girl(i) = girls(i)/(pop);

        %Only families that had a boy continue to reproduce
        x = x(x==1);

        %new population of reproducing parents
        pop = length(x);

        %check that there are no more boys 
        if num_boys==0

            boys(i+1:end)=[];
            girls(i+1:end)=[];
            prob_of_girl(i+1:end)=[];
            break

        end
    end

    prob_of_girl_est(p) = mean(prob_of_girl(prob_of_girl~=0));
    sex_ratio(p) = sum(boys)/sum(girls);
    rounds_of_reproduction(p) = length(boys);
end

scatter(prob_of_girls,prob_of_girl_est)
hold on
title('Est. vs. True Probability of a Girl Birth')
ylabel('Est. Probability of Girl Birth')
xlabel('True Probability of Girl Birth')
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.2 0.8 0.2 0.8])

scatter(prob_of_girls,sex_ratio)
hold on
title('Sex Ratio as a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Sex Ratio: $\frac{E(Boys)}{E(Girls)}$','interpreter','latex')

scatter(prob_of_girls,rounds_of_reproduction)
hold on
title('Rounds of Reproduction a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Rounds of Reproduction')

Il grafico seguente è previsto data la legge forte del gran numero. Lo riproduco, ma il grafico che conta è il secondo grafico.

inserisci qui la descrizione dell'immagine

Qui, una probabilità di popolazione diversa da 0,5 per la nascita di entrambi i sessi di un bambino altererà il rapporto tra i sessi nella popolazione generale. Supponendo che le nascite siano indipendenti (ma non la scelta di continuare a riprodursi), in ogni ciclo di riproduzione condizionale la probabilità della popolazione governa la composizione complessiva dei risultati delle nascite di maschi e femmine. Quindi, come altri hanno già detto, la regola di arresto nel problema è irrilevante per l'esito della popolazione, come ha risposto il poster che ha identificato questa come distribuzione geometrica.

inserisci qui la descrizione dell'immagine

Per completezza, ciò che influenza la regola di arresto è il numero di cicli di riproduzione nella popolazione. Poiché eseguo l'esperimento solo una volta, il grafico è un po 'frastagliato. Ma l'intuizione è lì: per una data dimensione della popolazione, con l'aumentare della probabilità della nascita di una ragazza vediamo che le famiglie hanno bisogno di meno cicli di riproduzione per ottenere la ragazza desiderata prima che l'intera popolazione smetta di riprodursi (ovviamente il numero di giri dipenderà dal dimensione della popolazione, dal momento che aumenta meccanicamente la probabilità che una famiglia abbia, ad esempio, 49 ragazzi prima di avere la loro prima ragazza)

inserisci qui la descrizione dell'immagine

Il confronto tra i miei rapporti sessuali calcolati:

[sex_ratio' prob_of_boy']

0.3327    0.2500
0.4289    0.3000
0.5385    0.3500
0.6673    0.4000
0.8186    0.4500
1.0008    0.5000
1.2224    0.5500
1.5016    0.6000
1.8574    0.6500
2.3319    0.7000
2.9995    0.7500

e quelli del poster precedente con il codice matlab:

[boys./girls testRange']

0.8199    0.4500
0.8494    0.4600
0.8871    0.4700
0.9257    0.4800
0.9590    0.4900
1.0016    0.5000
1.0374    0.5100
1.0836    0.5200
1.1273    0.5300
1.1750    0.5400
1.2215    0.5500

Sono risultati equivalenti.


1

Dipende dal numero di famiglie.

Xp=0.5

P(X=X)=0.5X,X=1,2,3 ...
E(X)=2

N

NΣXio

ΣXio/NE(X)=2N

TT=ΣXioT

P(T=t)=CN-1t-10.5t,t=N,N+1 ...

E[NΣXio]=E[NT]=Σt=NNtCN-1t-10.5t=2F1(N,1,N+1,-1)
2F1 è la funzione ipergeometrica.

2F1(N,1,N+1,-1)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.