Possiamo accettare il null nei test di non inferiorità?


11

In un normale test t di mezzi, usando i soliti metodi di verifica delle ipotesi, rifiutiamo il null o non riusciamo a rifiutare il null ma non accettiamo mai il null. Uno dei motivi è che se avessimo più prove, la stessa dimensione dell'effetto diventerebbe significativa.

Ma cosa succede in un test di non inferiorità?

Questo è:

H0:μ1μ0x

vs.

H1:μ1μ0>x

dove è una quantità che consideriamo essenzialmente la stessa. Quindi, se rifiutiamo il null diciamo che è maggiore di di almeno . Non riusciamo a respingere il null se non ci sono prove sufficienti. μ 1 μ 0 xxμ1μ0x

Se la dimensione dell'effetto è o maggiore, questo è analogo al normale test t. Ma cosa succede se la dimensione dell'effetto è inferiore a nel campione che abbiamo? Quindi, se aumentassimo le dimensioni del campione e mantenessimo lo stesso effetto, rimarrebbe non significativo. Possiamo quindi accettare il null in questo caso?xxx


1
Le tue ipotesi sono confuse? Normalmente, per un test NI l'ipotesi nulla è che la differenza sia maggiore di x, mentre l'alternativa è che è les o uguale a x. Immagino che dipenda dall'ordine della tua scala delle differenze.
Björn

Ciao @ Björn dipenderà dal fatto che più alto è peggio o più alto è meglio.
Peter Flom

1
È come chiedere se si può accettare il null nei test unilaterali? Si è discusso di questo nei commenti a stats.stackexchange.com/a/85914 .
amoeba

2
@amoeba Penso che Peter presenti un argomento affascinante (+1), forse più simile a un paradosso. Una spiegazione convenzionale del perché non "accettiamo H0" a volte si sente è "se avessimo più prove, la stessa dimensione dell'effetto diventerebbe significativa". Ma seguendo questa logica come fa Peter, o giungiamo alla conclusione che in alcune situazioni dovremmo "accettare H0" o, in caso contrario, che la "ragione" sia effettivamente sbagliata, e non il motivo per cui lo facciamo affatto. Credo che tu abbia ragione - la sua argomentazione si applicherebbe anche ai test t unilaterali, poiché una dimensione dell'effetto negativo rimane insignificante all'aumentare di n
Silverfish

1
Sì, sono d'accordo: la risposta collegata non risponde alla tua domanda. Ho fornito il link solo perché c'era una discussione correlata nei commenti lì.
ameba,

Risposte:


7

La tua logica si applica esattamente allo stesso modo ai buoni vecchi test unilaterali (cioè con ) che possono essere più familiari ai lettori. Per concretezza, immagina che stiamo testando il null contro l'alternativa che è positiva. Quindi se true è negativo, l'aumento della dimensione del campione non produrrà un risultato significativo, cioè, per usare le tue parole, non è vero che "se avessimo più prove, la stessa dimensione dell'effetto diventerebbe significativa".H 0 : μ 0 μ μx=0H0:μ0μμ

Se , possiamo avere tre possibili esiti:H0:μ0

  1. Innanzitutto, l' intervallo di confidenza può essere completamente sopra lo zero; quindi rifiutiamo il null e accettiamo l'alternativa (che è positivo).μ(1α)100%μ

  2. In secondo luogo, l'intervallo di confidenza può essere completamente inferiore a zero. In questo caso non rifiutiamo il null. Tuttavia, in questo caso penso che sia giusto dire che "accettiamo il null", perché potremmo considerare come un altro null e rifiutarlo.H1

  3. In terzo luogo, l'intervallo di confidenza può contenere zero. Quindi non possiamo rifiutare e neanche , quindi non c'è niente da accettare.H 1H0H1

Quindi direi che in situazioni unilaterali si può accettare il nulla, sì. Ma non possiamo accettarlo semplicemente perché non l'abbiamo rifiutato; ci sono tre possibilità, non due.

(Esattamente lo stesso vale per i test di equivalenza detti anche "test a due facciate" (TOST), test di non inferiorità, ecc. Si può rifiutare il nulla, accettare il nulla o ottenere un risultato inconcludente.)

Al contrario, quando è un punto null come , non possiamo mai accettarlo, perché non costituisce un'ipotesi nulla valida.H 0 : μ = 0 H 1 : μ 0H0H0:μ=0H1:μ0

(A meno che possa avere solo valori discreti, ad esempio deve essere intero; allora sembra che potremmo accettare perché ora non costituisce un valore valido ipotesi. Questo è un po 'di caso speciale.)H 0 : μ = 0 H 1 : μ Z , μ 0μH0:μ=0H1:μZ,μ0


Questo problema è stato discusso qualche tempo fa nei commenti sotto la risposta di @ gung qui: Perché gli statistici dicono che un risultato non significativo significa "non si può rifiutare il nulla" invece di accettare l'ipotesi nulla?

Vedi anche un thread interessante (e sotto votato) Se non si respinge il nulla nell'approccio Neyman-Pearson significa che si dovrebbe "accettarlo"? , dove @Scortchi spiega che nel framework Neyman-Pearson alcuni autori non hanno problemi a parlare di "accettare il nulla". Questo è anche il significato di @Alexis nell'ultimo paragrafo della sua risposta qui.


Se l' intervallo di confidenza è completamente al di sopra dello zero, rifiuta il valore null che : si tratta di un test con una dimensione nel caso peggiore di . Se l' intervallo di confidenza è completamente inferiore a zero, respingere il valore null che : si tratta di un test con una dimensione nel caso peggiore di . Combinando i due test è possibile mantenere una dimensione nel caso peggiore di perché i due null si escludono a vicenda. Quindi i tre risultati possono essere descritti in termini di accettazione di un'alternativa o di un'altra alternativa o del rifiuto di nessuno dei due. μ 0 α(1α)μ0 (1-α)μ>0αα2(1α)μ>0 αα2α2
Scortchi - Ripristina Monica

Un test a due code può essere pensato in modo simile come composto da due test a una facciata; ma le alternative non si escludono a vicenda e la dimensione peggiore è (quando ). μ = 0αμ=0
Scortchi - Ripristina Monica

Grazie @Scortchi. In qualche modo non sono del tutto sicuro che tu sia d'accordo o in disaccordo con la mia risposta.
ameba,

Come non è accettata in quanto nulla in un test, ma qua alternativa in un altro, mi sento "accettando il null" è inutilmente confusa qui; tuttavia la tua procedura dovrebbe soddisfare coloro che hanno il bisogno di farlo. Ciò che forse merita maggiore enfasi nella tua risposta è la differenza tra la combinazione di test per non inferiorità vs inferiorità e viceversa e test per superiorità vs non superiorità (o zero null) e inferiorità vs non inferiorità (o zero null) . μ0
Scortchi - Ripristina Monica

@Scortchi La sintassi della tua ultima frase è piuttosto complicata: che cosa può esattamente (o non può) essere combinato e qual è esattamente la differenza? Non sono sicuro di averti capito correttamente, scusa.
Amoeba,

6

Non accettiamo mai "l'ipotesi nulla" (senza considerare anche la potenza e la dimensione minima dell'effetto rilevante). Con un singolo test di ipotesi, poniamo uno stato di natura, , e quindi rispondiamo a qualche variazione della domanda "quanto è improbabile che abbiamo osservato i dati sottostanti la nostra statistica di test, assumendo (e il nostro distributivo presupposto) è vero? " Rifiuteremo o non a respingere il nostro base a un tasso di errore di tipo I preferito e trarremo una conclusione che riguarda sempre ... ovvero abbiamo trovato prove per concludere , oppure abbiamo fatto non trovare prove per concludere . Non accettiamo H 0 H 0 H A H A H A H 0H0H0H0HAHAHAH0perché non abbiamo cercato prove per questo. L'assenza di prove (ad esempio, di una differenza), non è la stessa cosa di prove di assenza (ad esempio, di una differenza). .

Questo vale per i test su un lato, così come per i test su due lati: cerchiamo solo prove a favore di e le troviamo o non le troviamo.HA

Se poniamo solo un singolo (senza prestare particolare attenzione sia alla dimensione minima dell'effetto rilevante, sia al potere statistico), stiamo effettivamente assumendo un impegno a priori per la distorsione di conferma , perché non abbiamo cercato prove per , solo prove per . Naturalmente, noi possiamo (e, oserei dire, dovrebbe ) ipotesi posa nulli a favore e contro una posizione ( rilevanza test che uniscono i test per la differenza ( ) con prove di equivalenza (H0 H AH0HA H - 0H0+H0 ) fa proprio questo).

Mi sembra che non vi sia alcun motivo per cui non sia possibile combinare l'inferenza da un test unilaterale per l'inferiorità con un test unilaterale per la non inferiorità per fornire prove (o mancanza di prove) in entrambe le direzioni contemporaneamente.

H0δH0


1
La domanda di Peter conteneva un punto particolarmente interessante che questa risposta sembra aggirare: che una delle spiegazioni convenzionali fornite della terminologia standard "non rifiutare H0" è che, ad esempio, in un test t, se ottenessimo più prove, lo stesso effetto la dimensione diventerebbe significativa. Ma se questa fosse la "vera" ragione che "non riusciamo a respingere", la sua argomentazione secondo cui potremmo "accettare H0" nelle circostanze che delinea sembra (almeno per me) essere forte - anche se non sono sicuro di l'ho visto fatto non casualmente, come una specie di gergo statistico, piuttosto che consapevolmente e deliberatamente.
Pesce d'argento

1
Questa risposta ribadisce la posizione convenzionale di "accettare H0" in un modo piacevole, chiaro e conciso, ma non sembra affrontare direttamente l'argomento (o forse il paradosso) al centro della domanda di Peter. Cosa ne pensi del "non possiamo accettare H0 perché se avessimo più prove, la stessa dimensione dell'effetto diventerebbe significativa" argomento per la terminologia convenzionale - c'è qualche difetto nella presentazione o estensione di Peter, o era la logica dell'argomento originale non valido in primo luogo?
Pesce d'argento

1
@Silverfish segui il link nella mia risposta ai "test di pertinenza" per una maggiore amplificazione della mia risoluzione critica al problema di "non possiamo accettare H0 perché se avessimo più prove, la stessa dimensione dell'effetto diventerebbe significativa"
Alexis

1
@Alexis Sono d'accordo con Silverfish. Apprezzo la tua risposta, ma non affronta il mio punto centrale, per il motivo enunciato Silverfish. Se avessimo N = 1.000.000, praticamente qualsiasi differenza sarebbe significativa nell'impostazione standard. Ma nel caso della non inferiorità, non è così. E anche in TOST a due facciate, non è così. Se la differenza è inferiore all'importo che riteniamo importante, allora nessuna N lo renderà sig.
Peter Flom

1
Chiedo scusa: il mio primo commento era inteso semplicemente come preludio al secondo (o più precisamente, il secondo era lo straripamento del primo!) E non era destinato a sollevare un punto indipendente. Il link è stato utile, grazie. Il tuo punto centrale (che hai messo molto bene, sia nella tua risposta che nella tua riaffermazione) spiega chiaramente perché non sei d'accordo con la conclusione di Pietro . Ma ero curioso di sapere dove tu sentissi il difetto nella sua logica - o forse la sua premessa . Questa è la parte che mi è sembrata di non essere stata affrontata direttamente.
Silverfish
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.