Spiegazione del fattore di correzione finito


25

Comprendo che quando il campionamento da una popolazione finita e la nostra dimensione del campione è superiore al 5% della popolazione, abbiamo bisogno di una correzione sulla media e sull'errore standard del campione usando questa formula:

FPC=NnN1

Dove è la dimensione della popolazione e n è la dimensione del campione.Nn

Ho 3 domande su questa formula:

  1. Perché la soglia è impostata al 5%?
  2. Come è stata derivata la formula?
  3. Ci sono altre risorse online che spiegano in modo completo questa formula oltre a questo documento?

8
Non correggi la media!
whuber

2
Correggi solo la varianza.
SmallChess

Risposte:


25

La soglia è scelta in modo tale da garantire la convergenza della distribuzione ipergeometrica ( è la sua SD), invece di una distribuzione binomiale (per campionamento con sostituzione), a una distribuzione normale (questo è il Teorema del limite centrale, vedi ad esempio,La curva normale,Il teorema del limite centrale e Le disuguaglianze di Markov e Chebychev per Variabili casuali). In altre parole, quandon/N0,05(ovvero,nnon è "troppo grande" rispetto aN), l'FPC può essere tranquillamente ignorato; è facile vedere come il fattore di correzione si evolve variandonper unNfisso: conN=10,000, abbiamoFPC.9995NnN1n/N0.05nNnNN=10,000FPC=.9995quando mentre FPC = .3162 quando n = 9 , 000 . Quando N n=10FPC=.3162n=9,000N , l'FPC si avvicina a 1 e siamo vicini alla situazione del campionamento con la sostituzione (cioè, come con una popolazione infinita).

Per comprendere questi risultati, un buon punto di partenza è leggere alcuni tutorial online sulla teoria del campionamento in cui il campionamento viene eseguito senza sostituzione ( semplice campionamento casuale ). Questo tutorial online sulle statistiche non parametriche ha un'illustrazione sul calcolo delle aspettative e della varianza per un totale.

Noterai che alcuni autori usano invece di N - 1 nel denominatore dell'FPC; infatti, dipende dal fatto che lavori con il campione o la statistica della popolazione: per la varianza, sarà N invece di N - 1 se sei interessato a S 2 anziché a σ 2NN1NN1S2σ2 .

Per quanto riguarda i riferimenti online, posso suggerirti


Questa formula viene utilizzata per la popolazione finita, ma con sostituzione o senza sostituzione?
skan

3
@skan senza sostituzione.
Black Milk
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.