Le ipotesi nulla esemplificano il significato di "Tutti i modelli sono sbagliati, ma alcuni sono utili". Sono probabilmente più utili se non presi alla lettera e fuori dal contesto - vale a dire, è importante ricordare lo scopo epistemico del nulla. Se può essere falsificato, che è l'obiettivo previsto, allora l'alternativa diventa più utile dal confronto, anche se ancora piuttosto disinformativa. Se rifiuti il nulla, stai dicendo che l'effetto probabilmente non è zero (o qualsiasi altra cosa - le ipotesi null possono specificare anche altri valori per la falsificazione) ... allora che cos'è?
La dimensione dell'effetto che calcoli è la migliore stima puntuale del parametro di popolazione. In generale, le probabilità dovrebbero essere ugualmente buone per essere sopravvalutate o sottostimate, ma le possibilità che si tratti di un occhio di bue morto sono infinitesimali, come suggerisce il commento di @ Glen_b. Se per qualche bizzarro colpo di scena del destino (o per costruzione - in entrambi i casi, suppongo che stiamo parlando ipoteticamente?) La tua stima cade direttamente su , questa non è ancora la prova che il parametro non ha un valore diverso all'interno l'intervallo di confidenza. Il significato dell'intervallo di confidenza non cambia in base al significato di qualsiasi test di ipotesi, tranne nella misura in cui può cambiare posizione e larghezza in modo correlato.0. 0¯
Nel caso in cui non si abbia familiarità con l'aspetto delle stime delle dimensioni dell'effetto per i campioni di una popolazione (simulata) di cui l'ipotesi nulla è letteralmente vera (o nel caso in cui non l'avessi ancora vista e sia qui solo per un po 'di intrattenimento statistico ), controlla di Geoff Cumming danza dei valorip . Nel caso in cui quegli intervalli di confidenza non siano abbastanza stretti per i tuoi gusti, ho provato a simulare alcuni dei miei in R usando campioni generati casualmente a meno di ciascuno da . Ho dimenticato di mettere un seme, ma ho impostato e poi ho corso tutte le volte che mi sono preoccupato prima di finire questa risposta, che alla fine mi ha dato 6000 campioni. Ecco un istogramma e un diagramma di densità usando eN ( 0 , 1 )n=1MN(0,1)x=c()
x=append(x,replicate(500,cor(rnorm(999999),rnorm(999999))))
hist(x,n=length(x)/100)
plot(density(x))
, rispettivamente:
Come ci si aspetterebbe, ci sono prove per una varietà di effetti diversi da zero derivanti da questi campioni casuali di una popolazione con effetto letteralmente zero, e queste stime sono distribuite più o meno normalmente attorno al parametro reale ( skew(x)
= -.005, kurtosis(x)
= 2.85). Immagina di conoscere solo il valore della tua stima da un campione di , non il vero parametro: perché dovresti aspettarti che il parametro sia più vicino allo zero della tua stima invece che ulteriore? Il tuo intervallo di confidenza potrebbe includere il valore nullo, ma il valore nullo non è in realtà più plausibile del valore della distanza equivalente dalla dimensione dell'effetto del campione nella direzione opposta, e altri valori potrebbero essere più plausibili di quello, in particolare la stima dei punti!n=1M
Se, in pratica, vuoi dimostrare che un effetto è più o meno zero, devi definire quanto più o meno sei incline a ignorare. Con questi enormi campioni che ho simulato, la stima della massima magnitudine che ho generato era . Con campioni più realistici di , il più grande che trovo tra campioni è . Ancora una volta, i residui sono normalmente distribuiti, quindi sono improbabili, ma il punto è che non sono plausibili.n = 999 1 M | r | = .14|r|=.004n=9991M|r|=.14
Un CI è probabilmente più utile per deduzione di un NHST in generale. Non rappresenta solo una cattiva idea che potrebbe essere supporre che il parametro sia trascurabilmente piccolo; rappresenta una buona idea di quale sia effettivamente il parametro. Si può ancora decidere se questo è trascurabile, ma si può anche avere un'idea di quanto non trascurabile possa essere. Per ulteriore sostegno agli intervalli di confidenza, vedere Cumming (2014 , 2013) .
Riferimenti
- Cumming, G. (2013). Comprensione delle nuove statistiche: dimensioni dell'effetto, intervalli di confidenza e meta-analisi . Routledge.
- Cumming, G. (2014). Le nuove statistiche: perché e come. Scienze psicologiche, 25 (7), 7–29. Estratto da http://pss.sagepub.com/content/25/1/7.full.pdf+html .