Perché abbiamo bisogno di avere ipotesi alternative?
In un test di ipotesi classica, l'unico ruolo matematico svolto dall'ipotesi alternativa è che influenza l'ordine delle prove attraverso la statistica del test scelta. L'ipotesi alternativa viene utilizzata per determinare la statistica test appropriata per il test, che equivale a stabilire una classifica ordinale di tutti i possibili risultati dei dati da quelli più favorevoli all'ipotesi nulla (rispetto all'alternativa dichiarata) a quelli meno favorevoli all'ipotesi nulla (contro l'alternativa dichiarata). Una volta formata questa classifica ordinale dei possibili risultati dei dati, l'ipotesi alternativa non svolge più alcun ruolo matematico nel test .
Spiegazione formale: In ogni verifica di ipotesi classica con n valori di dati osservabili x =( x1, . . . , xn) avete qualche statistica test T: Rn→ Rche mappa ogni possibile risultato dei dati su una scala ordinale che misura se è più favorevole all'ipotesi nulla o alternativa. (Senza perdita di generalità assumeremo che i valori più bassi siano più favorevoli all'ipotesi nulla e che i valori più alti siano più favorevoli all'ipotesi alternativa. A volte diciamo che i valori più alti della statistica test sono "più estremi" in quanto costituiscono più estremi prove per l'ipotesi alternativa.) Il valore p del test è quindi dato da:
p ( x ) ≡ pT( x ) ≡ P ( T( X ) ⩾ T( x ) | H0) .
Questa funzione di valore p determina completamente l'evidenza nel test per qualsiasi vettore di dati. Se combinato con un livello di significatività scelto, determina il risultato del test per qualsiasi vettore di dati. (Abbiamo descritto questo per un numero fisso di punti dati ma questo può essere facilmente esteso per consentire arbitrari .) È importante notare che il valore p è influenzato dalla statistica test solo attraverso la scala ordinale che inducenn, quindi se si applica una trasformazione monotonicamente crescente alle statistiche del test, questo non fa alcuna differenza al test di ipotesi (cioè è lo stesso test). Questa proprietà matematica riflette semplicemente il fatto che l'unico scopo della statistica del test è quello di indurre una scala ordinale sullo spazio di tutti i possibili vettori di dati, per mostrare quali sono più favorevoli allo null / alternativa.
L'ipotesi alternativa influenza questa misurazione solo attraverso la funzioneT , che viene scelta in base alle ipotesi null e alternative dichiarate all'interno del modello complessivo. Quindi, possiamo considerare la funzione statistica del test come una funzione del modello complessivo e le due ipotesi. Ad esempio, per un test del rapporto di verosimiglianza la statistica del test viene formata prendendo un rapporto (o logaritmo di un rapporto) dei supremi della funzione di verosimiglianza su intervalli di parametri relativi alle ipotesi null e alternative.T≡ g( M , H0, HUN)M
Cosa significa questo se confrontiamo i test con alternative diverse? Supponiamo di avere un modello fisso e di voler fare due diversi test di ipotesi confrontando la stessa ipotesi nulla con due diverse alternative e . In questo caso avrai due diverse funzioni statistiche di test:MH0HAH′A
T=g(M,H0,HA)T′=g(M,H0,H′A),
portando alle corrispondenti funzioni di valore p:
p(x)=P(T(X)⩾T(x)|H0)p′(x)=P(T′(X)⩾T′(x)|H0).
TT′pp′TT′