Il seguente estratto è dalla voce, Quali sono le differenze tra i test a una coda e due code? , sul sito di aiuto per le statistiche dell'UCLA.
... considera le conseguenze della mancanza di un effetto nell'altra direzione. Immagina di aver sviluppato un nuovo farmaco che ritieni sia un miglioramento rispetto a un farmaco esistente. Desiderate massimizzare la vostra capacità di rilevare il miglioramento, quindi optate per un test con una coda. In tal modo, non si verifica la possibilità che il nuovo farmaco sia meno efficace del farmaco esistente.
Dopo aver appreso le basi assolute del test di ipotesi e arrivare alla parte relativa a uno o due test di coda ... Capisco la matematica di base e la maggiore capacità di rilevamento di un test di coda, ecc ... Ma non riesco proprio a avvolgere la mia testa intorno a una cosa ... Qual è il punto? Non riesco davvero a capire perché dovresti dividere l'alfa tra i due estremi quando il risultato del tuo campione può essere solo nell'uno o nell'altro, o nessuno dei due.
Prendi lo scenario di esempio dal testo citato sopra. Come potresti "non riuscire a testare" per un risultato nella direzione opposta? Hai la tua media campionaria. Hai la tua popolazione media. L'aritmetica semplice ti dice quale è più alto. Cosa c'è da testare o non testare nella direzione opposta? Cosa ti impedisce di iniziare da zero con l'ipotesi opposta se vedi chiaramente che la media del campione è lontana dall'altra parte?
Un'altra citazione dalla stessa pagina:
Scegliere un test a una coda dopo aver eseguito un test a due code che non è riuscito a respingere l'ipotesi nulla non è appropriato, non importa quanto "vicino" a significativo fosse il test a due code.
Presumo che ciò valga anche per cambiare la polarità del test con una coda. Ma in che modo questo risultato "documentato" è meno valido che se tu avessi semplicemente scelto il corretto test con una coda in primo luogo?
Chiaramente mi manca una gran parte dell'immagine qui. Sembra tutto troppo arbitrario. Il che è, immagino, nel senso che ciò che denota "statisticamente significativo" - 95%, 99%, 99,9% ... È arbitrario per cominciare.