Sto cercando di apprendere le statistiche perché trovo che sia così diffusa che mi proibisce di imparare alcune cose se non le capisco bene. Ho difficoltà a comprendere questa nozione di distribuzione campionaria dei mezzi di campionamento. Non riesco a capire come alcuni libri e siti lo abbiano spiegato. Penso di avere una comprensione, ma non sono sicuro che sia corretto. Di seguito è il mio tentativo di capirlo.
Quando parliamo di un fenomeno che assume una distribuzione normale, generalmente (non sempre) riguarda la popolazione.
Vogliamo utilizzare le statistiche inferenziali per prevedere alcune cose su alcune popolazioni, ma non abbiamo tutti i dati. Usiamo campionamenti casuali e ogni campione di dimensione n ha la stessa probabilità di essere selezionato.
Quindi prendiamo molti campioni, diciamo 100 e quindi la distribuzione dei mezzi di quei campioni sarà approssimativamente normale secondo il teorema del limite centrale. La media dei mezzi di campionamento approssima la media della popolazione.
Ora quello che non capisco sono molte volte che vedi "Un campione di 100 persone ..." Non avremmo bisogno di 10 o 100 campioni di 100 persone per approssimare la popolazione della media? O è possibile che possiamo prelevare un singolo campione abbastanza grande, diciamo 1000 e poi diciamo che la media si avvicina alla media della popolazione? O prendiamo un campione di 1000 persone e quindi prendiamo 100 campioni casuali di 100 persone in ciascun campione da quelle 1000 persone originali che abbiamo preso e quindi lo usiamo come nostra approssimazione?
Il prelievo di un campione sufficientemente ampio per approssimare la media (quasi) funziona sempre? La popolazione deve anche essere normale affinché questo funzioni?