Numeri previsti di colori distinti quando si disegna senza sostituzione


15

Si consideri un'urna contenente N palline di P colori diversi, con pi essendo la percentuale di palline di colore i tra le N sfere ( ipi=1 ). Traccio nN palline dall'urna senza sostituzione e guardo il numero γ di diversi colori tra le palline che sono state disegnate. Qual è l'aspettativa di γ in funzione di n/N , a seconda delle proprietà adeguate della distribuzione p ?

Per dare più informazioni: se N=P e pi=1/P per tutti i , vedrò sempre esattamente n colori, cioè γ=P(n/N) . Altrimenti, si può dimostrare che l'aspettativa di γ è >P(n/N) . Per P e fissi N, sembrerebbe che il fattore per cui moltiplicare n/N sarebbe massimo quando pè uniforme; forse il numero atteso di colori diversi visto è limitato in funzione di n/N e, ad esempio, l'entropia di p ?

Ciò sembra correlato al problema del collezionista di coupon, tranne per il fatto che il campionamento viene eseguito senza sostituzione e la distribuzione dei coupon non è uniforme.


1
Penso che questo problema possa essere dichiarato come: qual è il numero previsto di voci diverse da zero in un campione da una distribuzione ipergeometrica multivariata ?
Kodiologo il

Risposte:


2

Supponiamo di avere k colori dove kN . Permettetemi bi indicano il numero di colore palle i così bi=N . Let B={b1,,bk} e lasciare Ei(B) notate l'insieme costituito dai i dell'elemento sottoinsiemi di B . Lascia che Qn,c indichi il numero di modi in cui possiamo scegliere nelementi dell'insieme precedente in modo tale che il numero di colori diversi nell'insieme scelto sia c . Per c=1 la formula è semplice:

Qn,1=EE1(B)(eEen)

Per c=2 possiamo contare set di palline di dimensione n che ha al massimo 2 colori meno il numero di set che hanno esattamente 1 colore:

Qn,2=EE2(B)(eEen)(k11)Qn,1

è il numero di modi in cui puoi aggiungere un colore a un colore fisso in modo tale da avere 2 colori se haikcolori in totale. La formula generica è se haic1colori fissi e vuoi farnec2colori pur avendokcolori in totale (c1c2k) è ( k-c1(k11)kc1c2kc1c2k. Ora abbiamo tutto per derivare la formula generica perQn,c:(kc1c2c1)Qn,c

Qn,c=EEc(B)(eEen)i=1c1(kici)Qn,i

La probabilità che tu abbia esattamente colori se disegni n palline è:cn

Pn,c=Qn,c/(Nn)

Si noti inoltre che sey>x.(xy)=0y>x

Probabilmente ci sono casi speciali in cui la formula può essere semplificata. Questa volta non mi sono preoccupato di trovare quelle semplificazioni.

Il valore atteso che stai cercando per il numero di colori dipendenti da è il seguente:n

γn=i=1kPn,ii

4
Chiami una probabilità, ma sembra che tu l'abbia definita come una somma di numeri interi. Hai dimenticato di dividere per qualcosa? Pn,c
Kodiologo il

Sì, immagino tu abbia ragione. Devi dividere per , ma sfortunatamente non è ancora così. SeE,FEc(B)edEFeseguo il doppio conto nella formula sopra. (Nn)E,FEc(B)EF
jakab922,

Sembra che la formula possa essere corretta usando il metodo del setaccio. Pubblicherò una correzione più tardi oggi.
jakab922,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.