Confusione su quando usare


15

Mi riferivo a questa lezione video per calcolare l'intervallo di confidenza . Tuttavia, ho un po 'di confusione. Questo ragazzo sta usando -statistics per il calcolo. Tuttavia, penso che avrebbe dovuto essere una statistica t . Non ci viene data la vera deviazione standard della popolazione. Stiamo usando la deviazione standard del campione per stimare quella vera.zt

Quindi perché ha preso la distribuzione normale per l'intervallo di confidenza piuttosto che ?t



Proprio come riferimento, lavorando il problema esposto sul video con una t statistica avrebbe prodotto: n <- 36; diff <- 12; sd <- 40; 2 * (pt(diff/(sd/sqrt(n)), df = n - 1) - 0.5) = 0.9195145.
Antoni Parellada,

Risposte:


10

Hai ragione, dovrebbe essere una distribuzione t. Ma poiché la dimensione del campione è 36 (cioè> 20), sarebbe appropriata anche la distribuzione az. Ricorda, con l'aumentare della dimensione del campione, la distribuzione t diventa più simile alla distribuzione z in forma.


21

Quando ho seguito il mio primo corso di statistica (dopo i dinosauri, ma quando i computer reali occupavano ancora un'intera stanza) ci hanno insegnato a usare la tabella z se c'erano più di 30 gradi di libertà, in parte perché la tabella t nel libro è salito solo fino a 30 gradi di libertà e se guardi la tabella t vedrai che da qualche parte intorno a 28 gradi di libertà otterrai gli stessi risultati della tabella z con 2 cifre significative (e quando fai tutto ciò a mano tendiamo arrotondare più spesso). Forse il presentatore è ancora di quella scuola.

Hai ragione a dire che se stai usando la deviazione standard del campione per un test sulla media dovresti davvero usare la distribuzione t indipendentemente dalle dimensioni (che è molto più facile fare in questi giorni) e usare z (standard normale) solo quando conoscere la deviazione standard della popolazione, ma per scopi pratici non si vedrà spesso una differenza significativa se la dimensione del campione è grande.


1
Ottimo aneddoto :)
Swiecki,

Uno sfortunato effetto collaterale del fatto che a volte è corretto usare gli intervalli z è che alcuni testi introduttivi presentano intervalli z anziché intervalli t. Ci sono molte aree della scienza in cui i campioni sono abbastanza piccoli da rendere gli intervalli z totalmente inappropriati. Ne parlo ai miei studenti ogni anno, con istruzioni esplicite ma ancora un numero considerevole di loro usa intervalli z :-(
Michael Lew

4

Sto facendo fatica a capire se Khan ha semplicemente semplificato le cose nel video o ha semplicemente sbagliato. Dovrei dire quest'ultimo, ma il problema non è nella z o t domanda . Sta chiamando ciò che calcola un intervallo di confidenza e poi dice che è sicuro al 92% che la media della popolazione rientri nell'intervallo dato. Semplicemente non è qualcosa che concludi da un intervallo di confidenza ... purtroppo.

Quindi torno alla domanda t vs. z e inizio a chiedermi se ha fatto un errore lì. Sto pensando che forse non perché afferma che se il campione è più piccolo devi fare una correzione. Quindi gli altri risponditori probabilmente hanno ragione su questo. Sta solo usando z perché l'ha già introdotto ed è abbastanza vicino con la n di 36. Non ho intenzione di passare attraverso tutti i video ma sto immaginando che introdurrà la distribuzione t in seguito, speriamo che il prossimo.

È davvero un peccato che Khan Academy abbia torto in così tante aree di statistiche ... ma forse mi sento così perché mi vengono solo indirizzati verso video con problemi.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.