Importa come campionare una popolazione?


9

Ho una vasca ben miscelata contenente un numero infinito di biglie. C'è una quantità infinita di marmi nella vasca, ma arrivano solo in un numero sconosciuto ma finito di varietà : è sconosciuto e per , disegnare un marmo di tipo potrebbe essere più probabile che disegnare un marmo di tipo .

V={v1,v2,v3,...,vk}
kijvivj

In un esperimento, una macchina campiona la vasca usando una procedura sconosciuta. La macchina riporta un set descrive le varietà di marmi dal suo campione: Xqk

XV;|X|=q

Le prove di questo esperimento vengono ripetute ( è fissato tra le prove) e otteniamo una sequenza di sottoinsiemi di , .qV(X1,X2,)

Le uniche altre cose che sappiamo sono:

  • le prove sono indipendenti e identiche
  • la macchina riporta le principali più frequenti nel suo campioneq

Non sappiamo esattamente come la macchina campiona i marmi. Potrebbe scegliere un gran numero di biglie, quindi riportare la più frequente. In alternativa, potrebbe continuare a raccogliere i marmi fino a quando non ci sono varietà. Ci sono anche altre cose che potrebbe fare.qq

La distribuzione delle nostre prove sarà influenzata dalla procedura di campionamento della macchina?(X1,X2,)


3
+1 Questa è un'ottima domanda perché apprezza il fatto che ci sia qualcosa di più nel campionamento casuale di qualche vaga forma di arbitrarietà o mancanza di conoscenza della procedura di campionamento.
whuber

La regola del campionamento sarà certamente importante. Altrimenti, considera questa procedura: la macchina, ad ogni prova, seleziona sempre un singolo marmo di tipo 1 (prima varietà). Ogni sorteggio sarà indipendente e avrà una distribuzione identica (banalmente) e otterrai q = 1, un risultato perfettamente non utile.
AlaskaRon

Risposte:


9

Un modo semplice per verificare che il metodo sia importante è scegliere le probabilità particolari per i tipi di marmi e calcolare la probabilità di ciascun sottoinsieme secondo alcuni metodi. Questo non può dimostrare che il metodo non abbia importanza, comunque.

Supponiamo che ci siano tipi e le probabilità di ciascun tipo sono rispettivamente , e . Supponiamo di scegliere tipi di marmi.31/21/41/42

Supponiamo che dopo aver scelto un marmo, ignori il resto del genere. La possibilità che ottieni è .{v2,v3}21/41/3=1/6

Supponiamo di rifiutare le coppie con tipi ripetuti. La possibilità di è{v2,v3}

21/41/421/41/4+21/21/4+21/21/4=1/81/8+1/4+1/4=1/5.

Poiché questi sono diversi, il metodo utilizzato dalla macchina è importante. Rifiutare le coppie con tipi ripetuti tende a pesare meno le coppie con tipi comuni.

Due dei metodi che menzioni sono equivalenti. Ignorare il resto del suo genere dopo aver raccolto un marmo equivale a raccogliere fino a quando non si hanno tipi diversi.q

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.