La distribuzione di probabilità di un'urna cambia mentre si trae da essa senza sostituirla in media?


9

Supponiamo che io abbia un'urna contenente N diversi colori di palline e che ogni colore diverso possa apparire un numero diverso di volte (se ci sono 10 palline rosse non è necessario che ci siano anche 10 palline blu). Se conosciamo il contenuto esatto dell'urna prima di disegnare possiamo formare una distribuzione di probabilità discreta che ci dice la probabilità di disegnare ogni colore di palla. Quello che mi chiedo è come cambia la distribuzione dopo aver disegnato k palle senza rimpiazzare l'urna in media. Capisco che mentre attingiamo dall'urna possiamo aggiornare la distribuzione con la conoscenza di ciò che è stato tolto, ma ciò che voglio sapere è ciò che ci aspetteremmo dalla forma della distribuzione dopo che avremo rimosso k palline. La distribuzione cambia in media o rimane invariata? Se non rimane lo stesso possiamo scrivere una formula per quello che ci aspettiamo che la nuova distribuzione assomigli in media dopo aver fatto k draw?


1
potrei sbagliarmi, ma sembra che si conosca la distribuzione precedente, ma non si è informati della probabilità (a parte che vengono rimosse le palline). in tal caso, suppongo che il posteriore sia uguale al precedente. Ad essere onesti - ci sono informazioni sulla probabilità che il numero di palline sia diminuito e che (per una pallina rimossa) la distribuzione sia quindi ad esempio bimodale tra il 50% di possibilità di 9 rosso e 10 di nero e il 50% di possibilità di 10 di rosso e 9 di nero . Devo sbagliarmi qui però
Wouter,

La mia intuizione è che è come l'ultimo caso che hai descritto. Tuttavia, non riesco a trovare nessuno che parli di questo tipo di processo.
mjnichol,

Risposte:


7
  1. "Calcolo diretto": lascia che ci siano sfere di colori nell'urna. Concentriamoci sulla probabilità di disegnare un colore particolare, diciamo bianco , sul secondo disegno. Lascia che il numero di palline bianche sia . Lasciate essere il colore della palla ottenuta alla -esimo disegnare.m n w X i inmnwXii

    P(X2=W)=P(X2=W|X1=W)P(X1=W)+P(X2=W|X1=W¯)P(X1=W¯)=nw1n1nwn+nwn1nnwn=nw(nnw+nw1)n(n1)=nwn=P(X1=W)

    Naturalmente questo stesso argomento si applica a qualsiasi colore sul secondo disegno. Possiamo applicare lo stesso tipo di argomento in modo ricorsivo quando si considerano i sorteggi successivi.

    [Si potrebbe ovviamente eseguire un calcolo ancora più diretto. Considera i primi disegni come costituiti da palline bianche e palline non bianche (con probabilità data dalla distribuzione ipergeometrica) ed esegui il calcolo corrispondente a quello sopra ma per il sorteggio nel passaggio ; si ottiene una semplificazione e una cancellazione simili, ma non è particolarmente illuminante da realizzare.]kk - i k + 1ikik+1

  2. Un argomento più breve: considera di etichettare le palline in modo casuale con i numeri , e poi di disegnarle in ordine etichettato. La domanda ora diventa "La probabilità che una determinata etichetta, , sia posizionata su una palla bianca è uguale alla probabilità che l'etichetta sia posizionata su una palla bianca?"k 11,2,...,nk1

    Ora vediamo che la risposta deve essere "sì" per simmetria delle etichette. Allo stesso modo, per simmetria dei colori delle sfere, non importa che abbiamo detto "bianco", quindi l'argomento che l'etichetta e l'etichetta hanno la stessa probabilità si applica a qualsiasi colore. Quindi la distribuzione al sorteggio -th è la stessa del primo sorteggio, purché non si disponga di ulteriori informazioni dai sorteggi precedenti (ovvero fino a quando non si vedono le palle disegnate in precedenza).1 kk1k


Strettamente correlato al tuo secondo modo, c'è un altro breve argomento: immagina l'insieme di tutte le possibili sequenze in cui le palle possono essere rimosse (ad esempio prima il blu, poi il bianco, poi il bianco, ... potrebbe essere una di queste sequenze). Se per ogni sequenza in questo set scambiamo gli elementi e , consentiamo semplicemente l'insieme. Quindi per ogni sequenza con una palla bianca (o qualsiasi altra cosa) in posizione , esiste esattamente una sequenza corrispondente con una palla bianca in posizione . Quindi la probabilità di una palla bianca in posizione o posizione deve essere la stessa. Penso che questo sia essenzialmente l'argomento di Neil. k t h k 1 k 11stkthk1k1
Silverfish,

@Silverfish Sì, guardandolo, il mio secondo argomento è essenzialmente lo stesso tipo di argomento dell'argomento di permutazione di Neil.
Glen_b

Grazie per la spiegazione. Era esattamente quello che dovevo vedere!
mjnichol,

6

L'unica ragione per cui non è perfettamente ovvio che la distribuzione rimane invariata (a condizione che rimanga almeno una palla) è che ci sono troppe informazioni. Eliminiamo il materiale che distrae.

Ignora, per un momento, il colore di ogni palla. Concentrati su una palla. Supponiamo che palle stiano per essere rimosse casualmente (e non osservate), quindi verrà disegnata e osservata una palla. Non fa differenza in quale ordine avvenga la selezione, quindi potresti anche osservare la prima palla estratta (e quindi rimuovere un'altra palla se insisti). La distribuzione ovviamente non è cambiata, perché non sarà influenzata dalla rimozione delle altre palle.k + 1 k kkk+1kk


Questo argomento, sebbene perfettamente valido, potrebbe far sentire alcune persone a disagio. La seguente analisi potrebbe essere accettata come più rigorosa, perché non ci chiede di ignorare l'ordine di selezione.

Continua a concentrarti sulla tua palla. Avrà una certa probabilità di essere selezionata come palla. Sebbene sia facile da calcolare, non abbiamo bisogno di conoscerne il valore: tutto ciò che conta è che deve avere lo stesso valore per ogni palla (perché tutte le palle sono equivalenti) e che deve essere diverso da zero. Ma se fosse zero, nessuna palla avrebbe alcuna probabilità di essere selezionata: fino a quando rimane almeno una palla, . k + 1 p k p k0pkk+1pkpk0

Presta di nuovo attenzione ai colori. Per definizione, la possibilità che venga scelto un particolare colore (dopo che le palline vengono rimosse in modo casuale) è la somma delle probabilità di tutte le palline colorate in originali divisa per la somma delle probabilità di tutte le palline originali. Quando in origine ci sono sfere di colore e sfere totali, quel valore èk C k C C nCkCkCCn

Prk(C)=kcpknpk=kcn.

Quando non dipende da , QED .k<nk


Grazie per il commento. Mi ha aiutato a capire di più i processi sottostanti!
mjnichol,

2

Lascia che la distribuzione del sorteggio di una singola palla - dopo aver già disegnato palle senza sostituzione - abbia una distribuzione categorica data la distribuzione su tali distribuzioni categoriche .kE(Dk)Dk

Immagino tu stia chiedendo se è costante.E(Dk)

Penso che sia. Supponi che alla fine tu disegni tutte le palle. Tutte le permutazioni delle palle sono ugualmente probabili. La probabilità di disegnare inizialmente è . Potresti riordinare le tue scelte a una permutazione altrettanto probabile per cui la prima palla scelta è stata scelta per ultima e la seconda scelta è stata scelta per prima. Quella palla ha aspettativa , che deve essere uguale a causa della simmetria. Per induzione, sono tutti uguali.E(D0)E(D1)E(D0)E(Di)


Vuoi dire che sto chiedendo se è costante per ogni k, giusto? E(Dk)
mjnichol,

@mjnichol right
Neil G

0

La "distribuzione prevista" non cambia. Si potrebbe usare un argomento martingala! Aggiungerò tale alla risposta più tardi (sto viaggiando ora).

La distribuzione, subordinata alle estrazioni precedenti (per le estrazioni successive) cambia solo quando si osservano effettivamente le estrazioni. Se disegni la palla dall'urna con una mano ben chiusa e poi la butti via senza osservarne il colore (ho usato il teatro in modo efficace come dimostrazione di classe), la distribuzione non cambia. Questo fatto ha una spiegazione: la probabilità riguarda le informazioni, la probabilità è un concetto di informazione.

Quindi le probabilità cambiano solo quando si ottengono nuove informazioni (probabilità condizionate, cioè). Disegnare la palla e gettarla via senza osservarla non ti dà alcuna nuova informazione, quindi nulla di nuovo da condizionare. Pertanto, quando si esegue il condizionamento sul set di informazioni effettive, ciò non è cambiato, quindi la distribuzione condizionale non può cambiare.

 EDIT

Non fornirò ora molti più dettagli a questa risposta, aggiungerò solo un riferimento: Hosam M. Mahmoud: "Pólya Urn Models" (Chapman & Hall), che tratta modelli di urne come quello in questa domanda, e anche un'urna molto più generalizzata schemi, anche utilizzando metodi martingala per ottenere risultati limite. Ma i metodi martingala non sono necessari per la domanda in questo post.


La distribuzione (per i disegni successivi) non cambia anche quando si osservano effettivamente i disegni. Perché l'osservazione di qualcosa dovrebbe cambiare qualcosa?
Neil G,

1
@Neil Penso che kjetil si riferisca alla distribuzione condizionata dai disegni osservati .
Silverfish

@Silverfish: Ah capisco. Hai ragione, mi scuso.
Neil G,

Modificherò per rendere più chiaro quando a casa in circa due settimane. Per ora vacanza a Venezia ...
kjetil b halvorsen,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.