Ha senso calcolare gli intervalli di confidenza e verificare le ipotesi quando sono disponibili dati di tutta la popolazione?


10

Ha senso calcolare gli intervalli di confidenza e verificare le ipotesi quando sono disponibili i dati dell'intera popolazione? A mio avviso, la risposta è no, dal momento che possiamo calcolare accuratamente i veri valori dei parametri. Ma allora, qual è la proporzione massima di dati dalla popolazione originale che ci consente di utilizzare le tecniche di cui sopra?


3
Se si utilizzano metodi a campione finito corretti, la varianza si azzera proprio mentre il campione raggiunge la dimensione della popolazione. Cioè, non c'è dimensione massima; le formule appropriate funzionano come dovrebbero, fino a . n=N
Glen_b -Restate Monica

Penso che dovresti dirlo più chiaramente se la domanda riguarda il caso "campione = popolazione" o caso "campione da popolazione finita".
ttnphns,

La prima parte della domanda riguarda il campione = popolazione e la seconda sul campione dalla popolazione (quando dimensione del campione <dimensione della popolazione).
Miroslav Sabo,

Risposte:


9

La prima domanda è una che generalmente non ha una risposta concordata. La mia opinione è come la tua, ma altri hanno sostenuto che una popolazione può essere vista come un campione da una "superpopolazione" in cui la natura esatta di una superpopolazione varia a seconda del contesto: ad esempio un censimento di tutte le persone che vivono in un edificio potrebbe essere visto come un campione di tutte le persone che vivono in edifici simili; un censimento della popolazione degli Stati Uniti (non che si possa mai essere veramente completi) potrebbe essere visto come un campione da una super popolazione di americani che un giorno potrebbero esistere (o qualcosa del genere). Penso che questa sia spesso una scusa per arrivare a usare i valori p; molti scienziati in settori sostanziali non sono a proprio agio se non hanno un valore p. (Ma questa è la mia opinione).

La seconda domanda sembra un po 'strana a rispondere in modo generale. Quando si ottiene un campione che è (diciamo) anche più della metà della popolazione?

Un problema più grande sarà la distorsione. Tornando al censimento degli Stati Uniti, il problema non è semplicemente che gli manca la gente, ma che le persone che manca non sono un campione casuale della popolazione totale; quindi, anche se il censimento ottiene risposte (per scegliere un numero) il 95% di tutte le persone, se quel 5% rimanente è abbastanza diverso, i risultati saranno distorti.


1
Penso che tu calcoli o meno gli intervalli di confidenza per una statistica della popolazione dipende dal fatto che tu voglia fare delle deduzioni sulla popolazione effettiva o per l'ipotetica "super popolazione". In un lavoro passato presso un dipartimento sanitario statale abbiamo riportato statistiche annuali come percentuali molto basse di peso alla nascita e tassi di suicidio che sono rimbalzati di anno in anno. Sì, stavamo riferendo sull'intera popolazione, ma sarebbe sciocco incardinare i progressi della salute dello Stato (e finanziamenti!) Su ogni aumento o diminuzione di questi e altri indicatori sanitari come un cambiamento completo nella salute della popolazione.
RobertF

7

Supponiamo che solo 2 membri su 12 del comitato siano donne.

La proporzione può essere presa come una descrizione statistica dell'intera popolazione (il comitato). Forse qualcosa dovrebbe essere fatto per correggere lo squilibrio, indipendentemente da come è sorto.16

Oppure può essere preso come una stima della probabilità che una donna venga selezionata per il comitato, una proprietà del processo di selezione. Puoi mettere degli intervalli di confidenza attorno ad esso, verificare se è significativamente diverso dalla metà (o un'altra ipotesi nulla pertinente) e così via. Forse il processo deve essere modificato per renderlo equo.

Le due visioni, descrittive e inferenziali, non sono contraddittorie, ma abbastanza distinte.

La risposta alla seconda domanda è che ha senso calcolare gli intervalli di confidenza e testare le ipotesi su un parametro di popolazione anche se solo un singolo individuo non è campionato. Basta notare che gli EC e i test devono tenere conto di una parte considerevole della popolazione campionata: vedi correzione della popolazione finita .

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.