Lascio questo paragrafo perché i commenti abbiano un senso: probabilmente l'assunzione della normalità nelle popolazioni originali è troppo restrittiva e può essere dimenticata concentrandosi sulla distribuzione del campionamento e grazie al teorema del limite centrale, specialmente per campioni di grandi dimensioni.
Applicando la t test è probabilmente una buona idea se (come avviene di solito) non si conosce la varianza della popolazione e si utilizzano invece le varianze del campione come stimatori. Si noti che l'assunzione di varianze uguali può avere bisogno di essere testati con un test F delle varianze o di un test Lavene prima di applicare una varianza pooled - Ho alcune note su GitHub qui .
Come accennato, la distribuzione t converge alla distribuzione normale all'aumentare del campione, come dimostra questo diagramma R veloce:
In rosso è il pdf di una distribuzione normale, e in viola, puoi vedere il progressivo cambiamento delle "code grasse" (o code più pesanti) del pdf della t distribuzione man mano che i gradi di libertà aumentano fino a quando non si fonde infine con il trama normale.
Quindi applicare un test z sarebbe probabilmente OK con campioni di grandi dimensioni.
Affrontare i problemi con la mia risposta iniziale. Grazie, Glen_b per il tuo aiuto con l'OP (i probabili nuovi errori di interpretazione sono interamente miei).
- LA STATISTICA S SEGUE ALLA DISTRIBUZIONE AI SENSI DELLA NORMALITÀ:
Lasciando da parte le complessità nelle formule per un campione v. Due campioni (accoppiato e non accoppiato), la statistica t generale focalizzata sul caso di confrontare una media campionaria con una media della popolazione è:
t-test = X¯- μSn√= X¯- μσ/ n√S2σ2---√= X¯- μσ/ n--√Σnx = 1( X- X¯)2n - 1σ2--------√(1)
Xμσ2 :
- ( 1 ) ∼ N( 1 , 0 ) .
- ( 1 )S2/ σ2n - 1∼ 1n - 1χ2n - 1( n - 1 ) s2/ σ2∼ χ2n - 1 come derivato qui .
- Numeratore e denominatore dovrebbero essere indipendenti.
statistica t ∼ t ( df= n - 1 ) .
- TEOREMA DI LIMITE CENTRALE:
La tendenza alla normalità della distribuzione campionaria del campione significa che con l'aumentare della dimensione del campione può giustificare l'assunzione di una distribuzione normale del numeratore anche se la popolazione non è normale. Tuttavia, non influenza le altre due condizioni (distribuzione chi quadro del denominatore e indipendenza del numeratore dal denominatore).
Ma non tutto è perduto, in questo post si discute come il teorema di Slutzky supporti la convergenza asintotica verso una distribuzione normale anche se la distribuzione chi del denominatore non è soddisfatta.
- ROBUSTEZZA:
Sulla carta "Uno sguardo più realistico alla robustezza e alle proprietà dell'errore di tipo II del test t alle deviazioni dalla normalità della popolazione" di Sawilowsky SS e Blair RC in Psychological Bulletin, 1992, Vol. 111, n. 2, 352-360 , dove hanno testato distribuzioni meno ideali o più "del mondo reale" (meno normali) per il potere e per gli errori di tipo I, si possono trovare le seguenti affermazioni: "Nonostante la natura conservatrice rispetto al tipo I errore del test t per alcune di queste distribuzioni reali, ci sono stati pochi effetti sui livelli di potenza per la varietà di condizioni di trattamento e dimensioni del campione studiate. I ricercatori possono facilmente compensare la leggera perdita di potenza selezionando una dimensione del campione leggermente più grande " .
" La visione prevalente sembra essere che il test t per campioni indipendenti sia ragionevolmente solido, per quanto riguarda gli errori di tipo I, alla forma della popolazione non gaussiana purché (a) le dimensioni del campione siano uguali o quasi, (b) campione le dimensioni sono abbastanza grandi (Boneau, 1960, menziona le dimensioni del campione da 25 a 30) e (c) i test sono a due code anziché a una coda. Si noti inoltre che quando queste condizioni sono soddisfatte e le differenze tra l'alfa nominale e l'alfa reale fanno si verificano, le discrepanze sono di solito di natura conservativa piuttosto che di natura liberale " .
Gli autori sottolineano gli aspetti controversi dell'argomento e non vedo l'ora di lavorare su alcune simulazioni basate sulla distribuzione lognormale menzionata dal professor Harrell. Vorrei anche presentare alcuni confronti di Monte Carlo con metodi non parametrici (ad esempio test U di Mann – Whitney). Quindi è un work in progress ...
SIMULAZIONI:
Disclaimer: Quello che segue è uno di questi esercizi nel "provarlo io stesso" in un modo o nell'altro. I risultati non possono essere usati per fare generalizzazioni (almeno non da parte mia), ma immagino di poter dire che queste due simulazioni MC (probabilmente imperfette) non sembrano essere troppo scoraggianti riguardo all'uso del test t nelle circostanze descritto.
Errore di tipo I:
n = 50μ = 0σ= 1
5 %4,5 % , non troppo male ...
In effetti, la trama della densità dei test t ottenuti sembrava sovrapporsi al pdf effettivo della distribuzione t:
La parte più interessante stava guardando il "denominatore" del test t, la parte che avrebbe dovuto seguire una distribuzione chi-quadrata:
( n - 1 ) s2/ σ2= 98( 49( SD2UN+ SD2UN) ) / 98( eσ2- 1 )e2 μ + σ2
.
Qui stiamo usando la deviazione standard comune, come in questa voce di Wikipedia :
SX1X2= ( n1- 1 )S2X1+ ( n2- 1 )S2X2n1+ n2- 2----------------------√
E, sorprendentemente (o meno), la trama era estremamente diversa dal pdf chi-quadrato sovrapposto:
Errore e alimentazione di tipo II:
La distribuzione della pressione arteriosa è possibile log-normale , il che risulta estremamente utile per impostare uno scenario sintetico in cui i gruppi di confronto sono separati in valori medi da una distanza di rilevanza clinica, ad esempio in uno studio clinico che verifica l'effetto di una pressione sanguigna concentrandosi sulla BP diastolica, un effetto significativo potrebbe essere considerato un calo medio di10 mmHg (una SD di circa 9 mmHg è stato scelto):
Esecuzione di test t di confronto su una simulazione Monte Carlo altrimenti simile a quella degli errori di tipo I tra questi gruppi fittizi e con un livello di significatività di 5 % finiamo con 0,024 % errori di tipo II e una potenza di solo 99 %.
Il codice è qui .