Perché abbiamo bisogno di ipotesi alternative?


14

Quando eseguiamo i test finiamo con due risultati.

1) Respingiamo l'ipotesi nulla

2) Non riusciamo a respingere l'ipotesi nulla.

Non parliamo di accettare ipotesi alternative. Se non parliamo di accettare ipotesi alternative, perché dobbiamo avere delle ipotesi alternative?

Ecco l'aggiornamento: qualcuno potrebbe darmi due esempi:

1) rifiutare un'ipotesi nulla equivale ad accettare un'ipotesi alternativa

2) rifiutare un'ipotesi nulla non equivale ad accettare un'ipotesi alternativa


1
Perché stai cercando di trarre alcune conclusioni. Se non è l'ipotesi nulla, allora forse è l'ipotesi alternativa (anche se non si è completamente sicuri che l'ipotesi alternativa sia valida, se si rifiuta l'ipotesi nulla). Quando respingi l'ipotesi nulla, dici che hai delle "prove" per concludere che l'ipotesi alternativa potrebbe essere vera.
nbro,

@nbro, grazie, ho aggiunto una domanda al mio post originale. Potresti dare un'occhiata?
user1700890

1
Non ho molta familiarità con il test delle ipotesi, in generale. È meglio aspettare che una persona più competente risponda alle tue domande.
nbro,

Se la tua ipotesi alternativa è un complemento dell'ipotesi nulla, non ha senso utilizzarla affatto. Nessuno utilizza in pratica ipotesi alternative per questo motivo al di fuori dei libri di testo.
Aksakal,

"Non parliamo di accettare ipotesi alternative" - ​​non è vero per tutti i possibili "noi". Alcune persone parlano dell'accettazione dell'ipotesi alternativa, e molti altri la pensano , anche se rispettano il tabù contro il dirlo . È in qualche modo pedante evitare di parlare dell'accettazione dell'ipotesi alternativa quando non vi è alcun ragionevole dubbio che sia vera. Ma poiché le statistiche sono così inclini a un uso improprio, in questo caso la pedanteria è probabilmente una buona cosa in quanto inculca cautela nell'interpretazione dei risultati.
John Coleman,

Risposte:


8

Mi concentrerò su "Se non parliamo di accettare ipotesi alternative, perché dobbiamo avere delle ipotesi alternative?"

Perché ci aiuta a scegliere una statistica test significativa e progettare il nostro studio per avere un alto potere --- un'alta probabilità di rifiutare il nulla quando l'alternativa è vera. Senza un'alternativa, non abbiamo un concetto di potere.

Immagina di avere solo un'ipotesi nulla e nessuna alternativa. Quindi non ci sono indicazioni su come scegliere una statistica di test che avrà un alto potere. Tutto ciò che possiamo dire è "Rifiuta il null ogni volta che osservi una statistica di test il cui valore è improbabile sotto il null". Possiamo scegliere qualcosa di arbitrario: possiamo disegnare numeri casuali Uniform (0,1) e rifiutare il valore nullo quando sono inferiori a 0,05. Ciò accade sotto il null "raramente", non più del 5% delle volte --- eppure è altrettanto raro quando il null è falso. Quindi questo è tecnicamente un test statistico, ma non ha senso come prova a favore o contro qualsiasi cosa.

Invece, di solito abbiamo qualche ipotesi alternativa scientificamente plausibile ( " V'è una differenza positiva nei risultati tra i gruppi di trattamento e di controllo nel mio esperimento"). Vorremmo difenderlo contro i potenziali critici che porterebbero l'ipotesi nulla come sostenitori del diavolo ("Non sono ancora convinto --- forse il tuo trattamento in realtà fa male, o non ha alcun effetto e nessuna apparente differenza nella i dati sono dovuti solo alla variazione di campionamento ").

Con queste 2 ipotesi in mente, ora possiamo impostare un potente test, scegliendo una statistica di test i cui valori tipici sotto l'alternativa sono improbabili sotto zero. (Una statistica t positiva a 2 campioni lontana da 0 non sorprende se l'alternativa è vera, ma sorprende se lo zero è vero.) Quindi calcoliamo la distribuzione di campionamento della statistica di prova sotto lo zero, in modo da poter calcolare i valori p --- e interpretarli. Quando osserviamo una statistica di test che è improbabile sotto zero, specialmente se il design dello studio, la dimensione del campione, ecc. Sono stati scelti per avere un alto potere , questo fornisce alcune prove per l'alternativa.

Quindi, perché non parliamo di "accettare" l'ipotesi alternativa? Perché anche uno studio ad alta potenza non fornisce prove completamente rigorose che il null sia sbagliato. È ancora una specie di prova, ma più debole di altri tipi di prove.


7

Storicamente, c'era disaccordo sul fatto che fosse necessaria un'ipotesi alternativa. Consentitemi di spiegare questo punto di disaccordo considerando le opinioni di Fisher e Neyman, nel contesto delle statistiche frequentiste, e una risposta bayesiana.

  • Fisher - Non abbiamo bisogno di un'ipotesi alternativa; possiamo semplicemente testare un'ipotesi nulla usando un test di bontà di adattamento. Il risultato è un valore , che fornisce una misura di evidenza per l'ipotesi nulla.p

  • Neyman - Dobbiamo eseguire un test di ipotesi tra un null e un'alternativa. Il test è tale da provocare errori di tipo 1 a una velocità fissa, predefinita, . Il risultato è una decisione: rifiutare o non rifiutare l'ipotesi nulla a livello .αα

    Abbiamo bisogno di un'alternativa dal punto di vista teorico decisionale - stiamo facendo una scelta tra due linee d'azione - e perché dovremmo segnalare la potenza del test Dovremmo cercare i test più potenti possibili per avere le migliori possibilità di rifiutare quando l'alternativa è vera.

    1p(Accept H0|H1)
    H0

    Per soddisfare entrambi questi punti, l'ipotesi alternativa non può essere quella vaga "non ".H0

  • Bayesiano - Dobbiamo considerare almeno due modelli e aggiornare la loro plausibilità relativa con i dati. Con un solo modello, abbiamo semplicemente indipendentemente dai dati che raccogliamo. Per fare calcoli in questo quadro, l'ipotesi alternativa (o modello come sarebbe noto in questo contesto) non può essere quella mal definita "non ". Lo chiamo mal definito poiché non possiamo scrivere il modello .

    p(H0)=1
    H0p(data|not H0)


1
Il tuo ultimo punto è eccellente e spesso trascurato nelle pubblicazioni che basano le loro argomentazioni su un unico NHST non motivato.
Konrad Rudolph,

Perché 'non ' è mal definito? H0
Michael,

Che cos'è? Puoi calcolare ? p(data|notH0)
Innisfree

@innisfree sotto concezione frequentista no, ma probabilmente sotto bayesiano.
Michael,

Prova a farlo senza introdurre almeno 2 modelli ...
innisfree

4

Non sono sicuro al 100% se si tratta di un requisito formale, ma in genere l' ipotesi nulla e l' ipotesi alternativa sono: 1) complementari e 2) esaustivi. Cioè: 1) non possono essere entrambi veri allo stesso tempo; 2) se uno non è vero, l'altro deve essere vero.

Considera un semplice test delle altezze tra ragazze e ragazzi. Una tipica ipotesi nulla in questo caso è che heightboys=heightgirls . Un'ipotesi alternativa sarebbe heightboysheightgirls . Quindi, se null non è vero, l'alternativa deve essere vera.


1
Sono completamente d'accordo con le tue affermazioni, ma si dovrebbe notare che sia che H a sono comunemente insiemi infinitamente grandi di ipotesi nulle. Sembra, inoltre, che molti sono convinti che H 0 e H un bisogno di non essere esaustivo, ad esempio, vedere questa o questa discussione. H0HaH0Ha
bi_scholar

2
@bi_scholar grazie per le discussioni. Non sono esperto in questo, ma sulla base di semplici ragionamenti credo che debbano essere esaustivi. Considera questo strano test: qualcuno trova 5 rocce disposte in ordine su una strada. Il suo : il vento ha fatto questo. Il suo H 1 : erano gli alieni. Ora, se mette alla prova la possibilità che il vento abbia fatto questo e trova una probabilità di 0,0001, rifiuta l'ipotesi del vento. Ma non gli dà il diritto di affermare che erano alieni. Tutto ciò che può affermare è che la possibilità che sia vento è piccola. Ma QUALSIASI altra spiegazione rimane aperta. H0H1
Karolis Koncevičius,

1
Sono d'accordo. Il mio ragionamento era che il test delle ipotesi riguardava l'accettazione o il rifiuto di mentre il rifiuto o l'accettazione di H a . Se H 0 e H un non sono esaustivi, non v'è alcun punto nel definire qualsiasi H un affatto, poiché anche quando rifiutiamo H 0 non possiamo accettare H uno , poiché esistono altre ipotesi di fuori di H 0 e H una che potrebbe anche essere vero. Purtroppo non sono riuscito a ottenere il mio punto nel primo thread. H0HaH0HaHaH0HaH0Ha
bi_scholar

1
@innisfree uno potrebbe verificare due ipotesi puntuali in una sorta di quadro di verosimiglianza - certo. Ma quella procedura non scommetterebbe chiamata "verifica dell'ipotesi nulla" ed è imprecisa. Sceglierebbe il più vicino come vero anche nei casi in cui nessuno di essi è vero. Inoltre, per quanto riguarda la potenza, si può scegliere un'ipotesi alternativa o la dimensione dell'effetto quando si calcola la potenza del test ma (a mio avviso) si dovrebbe dimenticare una volta che il test è in corso. A meno che non vi siano alcune informazioni precedenti che gli diano dei possibili effetti presenti nei dati. Come forse i pixel bianchi / neri in una foto rumorosa.
Karolis Koncevičius,

1
@innisfree Sono curioso di sapere come sarebbe un test del genere, potresti formulare un piccolo esempio? Sono convinto che non possiamo accettare rifiutando H 0 a meno che θ { 0 , 1 } che corrisponde a H 0 e H 1 sia esaustivo. θ=1H0θ{0,1}H0H1
bi_scholar,

2

Perché abbiamo bisogno di avere ipotesi alternative?

In un test di ipotesi classica, l'unico ruolo matematico svolto dall'ipotesi alternativa è che influenza l'ordine delle prove attraverso la statistica del test scelta. L'ipotesi alternativa viene utilizzata per determinare la statistica test appropriata per il test, che equivale a stabilire una classifica ordinale di tutti i possibili risultati dei dati da quelli più favorevoli all'ipotesi nulla (rispetto all'alternativa dichiarata) a quelli meno favorevoli all'ipotesi nulla (contro l'alternativa dichiarata). Una volta formata questa classifica ordinale dei possibili risultati dei dati, l'ipotesi alternativa non svolge più alcun ruolo matematico nel test .


Spiegazione formale: In ogni verifica di ipotesi classica con n valori di dati osservabili x=(x1,...,xn) avete qualche statistica test T:RnRche mappa ogni possibile risultato dei dati su una scala ordinale che misura se è più favorevole all'ipotesi nulla o alternativa. (Senza perdita di generalità assumeremo che i valori più bassi siano più favorevoli all'ipotesi nulla e che i valori più alti siano più favorevoli all'ipotesi alternativa. A volte diciamo che i valori più alti della statistica test sono "più estremi" in quanto costituiscono più estremi prove per l'ipotesi alternativa.) Il valore p del test è quindi dato da:

p(x)pT(x)P(T(X)T(x)|H0).

Questa funzione di valore p determina completamente l'evidenza nel test per qualsiasi vettore di dati. Se combinato con un livello di significatività scelto, determina il risultato del test per qualsiasi vettore di dati. (Abbiamo descritto questo per un numero fisso di punti dati ma questo può essere facilmente esteso per consentire arbitrari .) È importante notare che il valore p è influenzato dalla statistica test solo attraverso la scala ordinale che inducenn, quindi se si applica una trasformazione monotonicamente crescente alle statistiche del test, questo non fa alcuna differenza al test di ipotesi (cioè è lo stesso test). Questa proprietà matematica riflette semplicemente il fatto che l'unico scopo della statistica del test è quello di indurre una scala ordinale sullo spazio di tutti i possibili vettori di dati, per mostrare quali sono più favorevoli allo null / alternativa.

L'ipotesi alternativa influenza questa misurazione solo attraverso la funzioneT , che viene scelta in base alle ipotesi null e alternative dichiarate all'interno del modello complessivo. Quindi, possiamo considerare la funzione statistica del test come una funzione del modello complessivo e le due ipotesi. Ad esempio, per un test del rapporto di verosimiglianza la statistica del test viene formata prendendo un rapporto (o logaritmo di un rapporto) dei supremi della funzione di verosimiglianza su intervalli di parametri relativi alle ipotesi null e alternative.Tg(M,H0,HA)M


Cosa significa questo se confrontiamo i test con alternative diverse? Supponiamo di avere un modello fisso e di voler fare due diversi test di ipotesi confrontando la stessa ipotesi nulla con due diverse alternative e . In questo caso avrai due diverse funzioni statistiche di test:MH0HAHA

T=g(M,H0,HA)T=g(M,H0,HA),

portando alle corrispondenti funzioni di valore p:

p(x)=P(T(X)T(x)|H0)p(x)=P(T(X)T(x)|H0).

TTppTT


2
Concordo con questo, dicendo che il test è progettato per respingere l'ipotesi nulla di fronte a risultati estremi e il ruolo dell'ipotesi alternativa è quello di indicare quali risultati sarebbero visti come estremi se l'ipotesi nulla fosse vera
Henry

1

P(data|H0)H0

α

Il motivo per cui hai formulato un'ipotesi alternativa è perché probabilmente avevi in ​​mente un esperimento prima di iniziare il campionamento. La formulazione di un'ipotesi alternativa può anche decidere se utilizzare un test a una coda o due code e quindi darti più potere statistico (nello scenario a una coda). Ma tecnicamente per eseguire il test non è necessario formulare un'ipotesi alternativa, sono solo necessari i dati.


P(data|H0)P(data as extreme as that observed|H0)

@innisfree Sono d'accordo ed è esattamente come ho definito i dati in quella stessa frase.
Stefan

? Non riesco a vedere da nessuna parte dove sono definiti i dati (in quel modo o in altro modo)
innisfree

E anche se lo fosse, perché farlo? Perché ridefinire i dati in questo modo? Consiglio di chiarire le parti del testo attorno a p (dati ..
innisfree
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.