Qual è stato il contributo di Student (Gosset) nella formulazione del test t?


9

Una domanda recente , una domanda correlata e una fonte citata , mi hanno recentemente reso noto che la correzione per le stime campionarie della varianza della popolazione viene definita correzione di Bessel . Bessel era morto nel 1846 ( citazione di Wikipedia ) e il t-test fu pubblicato nel 1908 ( citazione di Wikipedia ). Per qualche ragione, avevo sempre supposto che il contributo di Gosset (aka Student) nella formulazione del test t fosse stato l'uso di nel calcolo di . Ora sembra che questo contributo appartenga chiaramente a Bessel. In questa ottica, chiedo quale sia stato il contributo di Gosset nella formulazione del test t?N-1N-1S2

Risposte:


7

EL Lehmann affrontò questa domanda in un'introduzione a una ristampa dell'articolo di Gosset del 1908 su Breakthroughs in Statistics, Volume II - Methodology and Distribution (Samuel Kotz & Norman L. Johnson, eds., 1992).

Lehmann per primo descrive lo stato dell'arte ai tempi di Gosset: equivaleva a un "test z" in cui la deviazione standard stimata veniva trattata come se fosse una costante. Quindi discute il contributo di Gosset:

Tuttavia, se la dimensione del campione è piccola, sarà soggetto a notevoli variazioni. È stato l'effetto di questa variazione che ha interessato Student, lo pseudonimo di WS Gosset .... Ha sottolineato che se si conosce la forma della distribuzione delle , questa variazione può essere presa in considerazione, poiché per ogni dato la distribuzione di viene determinata esattamente. Ha proposto di elaborare questa distribuzione nel caso in cui le siano normali.nS2XntX

Questo in effetti è quello che fece Gosset, sebbene senza rigore matematico: derivò alcune proprietà della distribuzione di per il caso normale, le abbinò a proprietà di distribuzioni conosciute e indovinò correttamente la sua distribuzione, riconoscendo che ciò era tutt'altro che rigoroso. A supporto delle sue ipotesi, ha condotto una simulazione Monte-Carlo utilizzando campioni di quattro da un set di dati.t

Gosset scrisse in modo pseudonimo perché il suo datore di lavoro (il birrificio Guinness) apparentemente riteneva che questa migliore comprensione della variazione di piccoli campioni fosse un po 'un vantaggio nel business: avrebbe portato a migliorare le procedure di controllo della qualità.


Grazie. Sembra che la mia risposta sia stata tritata. Inoltre, il tuo è migliore sotto quasi tutti gli aspetti.
Russellpierce,

3
Monte Carlo nel 1908 - a quei tempi gli uomini erano uomini ...
Korone,

@Corone È molto attento: probabilmente ha eseguito tutti i calcoli con carta e matita.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.