Numero previsto di carte invisibili quando si pescano carte da un mazzo di dimensioni


10

Abbiamo un mazzo di n carte. Ne pesciamo carte in modo uniforme a caso con sostituzione. Dopo 2n pesca qual è il numero atteso di carte mai scelte?

Questa domanda è parte 2 del problema 2.12 in

M. Mitzenmacher ed E. Upfal, Probabilità e informatica: algoritmi randomizzati e analisi probabilistica , Cambridge University Press, 2005.

Inoltre, per quello che vale, questo non è un problema di compiti a casa. È auto-studio e sono solo bloccato.

La mia risposta finora è:

Lasciate sia il numero di carte distinte visto dopo l' esimo disegnare. Poi:Xii

E[Xi]=k=1nk(knP(Xi1=k)+nk1nP(Xi1=k1))

L'idea qui è che ogni volta che pesciamo, o pesciamo una carta che abbiamo visto o pesciamo una carta che non abbiamo visto, e che possiamo definirla in modo ricorsivo.

Infine, la risposta alla domanda, quanti non abbiamo visto dopo pareggi, sarà .2nnE[X2n]

Credo che sia corretto, ma che ci deve essere una soluzione più semplice.

Qualsiasi aiuto sarebbe molto apprezzato.


Hai simulato e confrontato i risultati?
Adam,

Risposte:


10

Suggerimento: in ogni dato sorteggio, la probabilità che una carta non sia scelta è . E dal momento che stiamo disegnando con la sostituzione, presumo che possiamo dire che ogni sorteggio è indipendente dagli altri. Quindi la probabilità che una carta non sia scelta in pesca è ...n1n2n


3
(+1) Questo dà un buon primo inizio. Combinando questo con la linearità delle aspettative si ottiene una soluzione economica ed elegante.
cardinale il

6

Grazie Mike per il suggerimento.

Questo è quello che mi è venuto in mente.

Sia una variabile casuale di Bernoulli in cui se la carta non è mai stata pescata. Quindi , ma poiché è lo stesso per tutti , lascia che .XiXi=1ithpi=P(Xi=1)=(n1n)2npiip=pi

Ora lascia che sia il numero di carte non pescate dopo pesca.X=i=1nXi2n

QuindiE[X]=E[i=1nXi]=i=1nE[Xi]=i=1np=np

E penso che lo faccia.


4
(+1) Notare anche che per grande, . p e - 2npe2
Dilip Sarwate,

Potrebbe essere un po 'più complicato di così. La probabilità che la carta (i) sia mancata è come hai scritto. Tuttavia, una volta che sappiamo che la carta (i) è stata mancata, la probabilità di perdere la carta (j) cambia. Non so se la questione dell'indipendenza cambierà il risultato finale ma complica la derivazione.
Emil Friedman,

@Emil Friedman: le aspettative sono lineari indipendentemente dal fatto che i riepiloghi siano indipendenti o meno. La mancanza di indipendenza influisce su quantità come la varianza, ma non sulle aspettative.
Douglas Zare,

4

Ecco del codice R per convalidare la teoria.

evCards <- function(n) 
{
    iter <- 10000;
    cards <- 1:n;
    result <- 0;
    for (i in 1:iter) {
        draws <- sample(cards,2*n,T);
        uniqueDraws <- unique(draws,F);
        noUnique <- length(uniqueDraws);
        noNotSeen <- n - noUnique;
        result <- result + noNotSeen;
    }
    simulAvg <- result/iter;
    theoryAvg <- n * ((n-1)/n)^(2*n);
    output <-list(simulAvg=simulAvg,theoryAvg=theoryAvg);
    return (output);
}
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.