È possibile utilizzare un intervallo di confidenza (CI) per il test delle ipotesi. Nel caso tipico, se l'elemento della configurazione per un effetto non si estende su 0, è possibile rifiutare l'ipotesi nulla. Ma un elemento della configurazione può essere utilizzato per altro, mentre segnalare se è stato superato è il limite dell'utilità di un test.
Il motivo per cui ti consigliamo di usare CI invece di un semplice test t, ad esempio, è perché puoi fare molto più che testare le ipotesi. Puoi fare una dichiarazione sulla gamma di effetti che ritieni probabili (quelli nell'IC). Non puoi farlo con un solo test t. Puoi anche usarlo per fare dichiarazioni sul null, cosa che non puoi fare con un t-test. Se il t-test non rifiuta il null allora dite semplicemente che non potete rifiutare il null, il che non significa molto. Ma se hai un intervallo di confidenza stretto attorno al null, puoi suggerire che il null, o un valore vicino ad esso, è probabilmente il valore vero e suggerire che l'effetto del trattamento, o variabile indipendente, è troppo piccolo per essere significativo ( o che il tuo esperimento non
Aggiunto in seguito:
avrei davvero dovuto dirlo, mentre è possibile utilizzare un elemento della configurazione come un test, non è uno. È una stima di un intervallo in cui si ritiene che risiedano i valori dei parametri. Puoi fare test come inferenze ma stai molto meglio se non ne parli in quel modo.
Che è migliore?
A) L'effetto è 0,6, t (29) = 2,8, p <0,05. Questo effetto statisticamente significativo è ... (alcuni ne deriva di discussione su questo significatività statistica, senza alcuna menzione di o anche una forte capacità di discutere l'implicazione pratica della grandezza del ritrovamento ... in un quadro di Neyman-Pearson la grandezza del t e i valori di p sono praticamente insignificanti e tutto ciò di cui puoi discutere è se l'effetto è presente o non è stato trovato per essere presente. Non puoi mai davvero parlare del fatto che non c'è effettivamente un effetto basato sul test.)
o
B) Utilizzando un intervallo di confidenza al 95%, stimo che l'effetto sia compreso tra 0,2 e 1,0. (alcune discussioni seguono il parlare dell'effettivo effetto dell'interesse, se i suoi valori plausibili sono quelli che hanno un significato particolare e qualsiasi uso della parola significativo per esattamente ciò che dovrebbe significare. Inoltre, la larghezza dell'IC può andare direttamente a una discussione sul fatto che si tratti di una conclusione forte o se si può solo giungere a una conclusione più incerta)
Se hai preso una classe di statistica di base potresti inizialmente gravitare verso A. E ci possono essere alcuni casi in cui è un modo migliore per riportare un risultato. Ma per la maggior parte del lavoro B è di gran lunga superiore. Una stima dell'intervallo non è un test.