Giusto per chiarire in relazione al titolo, non stiamo usando la distribuzione t per stimare la media (nel senso di una stima puntuale almeno), ma per costruirne un intervallo.
Ma perché usare un preventivo quando puoi ottenere esattamente il tuo intervallo di confidenza?
È una buona domanda (fintanto che non insistiamo troppo su "esattamente", dal momento che i presupposti per la sua esatta distribuzione non saranno validi).
"È necessario utilizzare la tabella di distribuzione t quando si verificano problemi di funzionamento quando la deviazione standard della popolazione (σ) non è nota e la dimensione del campione è piccola (n <30)"
Perché le persone non usano la distribuzione T per tutto il tempo quando la deviazione standard della popolazione non è nota (anche quando n> 30)?
Considero il consiglio come - nella migliore delle ipotesi - potenzialmente fuorviante. In alcune situazioni, la distribuzione a T dovrebbe ancora essere usata quando i gradi di libertà sono molto più grandi di così.
Dove il normale è un'approssimazione ragionevole dipende da una varietà di cose (e quindi dipende dalla situazione). Tuttavia, poiché (con i computer) non è affatto difficile usare solo t , anche se i df sono molto grandi, dovresti chiederti perché è necessario preoccuparsi di fare qualcosa di diverso in n = 30.
Se le dimensioni del campione sono davvero grandi, non farà alcuna differenza evidente in un intervallo di confidenza, ma non credo che n = 30 sia sempre sufficientemente vicino a "veramente grande".
C'è una circostanza in cui potrebbe avere senso usare il normale piuttosto che la t - è allora che i tuoi dati chiaramente non soddisfano le condizioni per ottenere una distribuzione t, ma puoi ancora discutere per la normalità approssimativa della media (se n è abbastanza grande). Tuttavia, in tali circostanze, spesso la t rappresenta in pratica una buona approssimazione e può essere in qualche modo "più sicura". [In una situazione del genere, potrei essere propenso a indagare tramite simulazione.]