Perché gli errori di tipo II non sono enfatizzati tanto nella letteratura statistica?


10

Ho visto molti casi in cui sono riportati errori di tipo I (indicati da un valore alfa) in vari articoli di ricerca. Ho trovato raro che un ricercatore prenderà in considerazione il potere o l'errore di tipo II.

Gli errori di tipo II possono essere un grosso problema, giusto? Abbiamo accidentalmente respinto l'ipotesi alternativa quando in realtà era falsa. Perché i valori alfa sono enfatizzati tanto al posto dei valori beta?

Quando ho preso le statistiche del primo anno, non mi è mai stato insegnato beta - solo alfa. Sento che questi due errori dovrebbero essere trattati allo stesso modo. Tuttavia, solo l'alfa sembra essere enfatizzata.


1
+1 Il motivo è che tradizionalmente, l'errore di tipo I (aka, o livello di significatività ) viene fissato per primo, quindi il test viene costruito in modo tale da ridurre al minimo l'errore di tipo II (equivalentemente, per massimizzare la potenza). Un utile articolo su Wikipedia per capire il problema è quello relativo ai test UMP (Uniformly Most Powerful), en.wikipedia.org/wiki/Uniformly_most_powerful_testα
Jeremias K,

3
Ti sbagli su "abbiamo accettato l'ipotesi nulla" - non l' accettiamo mai . O "rifiutiamo null null" o "non riusciamo a rifiutare null hyp", ma non accettiamo mai null hyp!
cavernicolo,

fatto esplodere - mi ha sfiorato. Grazie per la segnalazione.

1
Fai attenzione a non confondere la tua esperienza con l'intero campo della letteratura statistica; difficilmente puoi dedurre il contenuto di materiale che non hai letto.
Glen_b

@glen giusto. Un titolo intelligente ottiene più risposte.

Risposte:


5

Questa è una buona domanda Vorrei iniziare con un paio di chiarimenti:


Penso che tu abbia (purtroppo) ragione nel dedicare meno attenzione al potere e agli errori di tipo II. Mentre penso che la situazione stia migliorando nella ricerca biomedica (ad esempio, le agenzie di finanziamento e gli IRB spesso richiedono analisi del potere ora), penso che ci siano un paio di ragioni per questo:

  1. Penso che il potere sia più difficile da comprendere per le persone rispetto al semplice significato. (Ciò è in parte dovuto a molte incognite, in particolare alla dimensione dell'effetto, ma ce ne sono anche altre).
  2. 0
  3. Gli scienziati hanno tradizionalmente supposto che gli errori di tipo I siano peggiori degli errori di tipo II.

1
Come sempre, illuminante - specialmente per i non matematici :-) ... Adoro questa formulazione ... Mi chiedo se potresti ampliare un po 'il terzo punto ... C'è qualche base per questo pregiudizio. So che è vero, ma perché pensi che sia così ... È perché riguarda il trofeo del valore p, e nient'altro conta?
Antoni Parellada,

Grazie, @AntoniParellada. Penserò a cosa potrei aggiungere di più.
gung - Ripristina Monica

2
Vorrei chiarire il punto 3) perché gli scienziati pensano che gli errori di tipo I siano peggiori. L'ipotesi nulla è di solito una sorta di "status quo", ad esempio l'effetto di questo nuovo farmaco è 0. Ci piace lo status quo e l'onere della prova è sul ricercatore dimostrare il contrario. Pertanto, vogliamo limitare l'errore di tipo I, ovvero rifiutiamo erroneamente lo status quo. IMO, questo attaccamento allo status quo è solo filosofico. Se vuoi cambiare la mia opinione, dovrai provarlo.
Heisenberg

1
In pratica, si potrebbe facilmente pensare a casi in cui l'errore di tipo II è molto più importante, vale a dire che il costo per non rifiutare il null è elevato. Ad esempio, se l'umanità dovesse affrontare un'epidemia di zombi, sono sicuro che l'atteggiamento sarebbe "provare qualsiasi farmaco anche se potrebbe non funzionare" piuttosto che "devi dimostrare che funziona prima di usarlo".
Heisenberg

Aggiunta a @Heisenberg: nei casi in cui gli errori di tipo II contano di più, si dovrebbe considerare il passaggio tra test di ipotesi puntuali e test di equivalenza. Nel tuo esempio, si dovrebbe dimostrare che almeno una proposta di salsa Worcester non peggiora l'epidemia di zombi. Quindi i tassi di errore cambiano il loro ruolo e il tasso di errore più importante viene risolto di nuovo in base alla progettazione. Inoltre, se si dispone di una stima dei costi di decisioni errate, si dovrebbe prendere in considerazione una regola di decisione che minimizzi il rischio e non (necessariamente) correggi un determinato tasso di errore di tipo I.
Horst Grünbusch,

2

Il motivo è che semplicemente non conosciamo l'attuale tasso di errore di tipo II e non lo faremo mai. Dipende da un parametro che di solito non conosciamo. A sua volta, se conoscessimo questo parametro, non avremmo bisogno di fare un test statistico.

Tuttavia, possiamo pianificare un esperimento in modo tale da soddisfare un tasso di errore specifico di tipo II, dato che alcune alternative sono vere. In questo modo, sceglieremmo una dimensione del campione che non spreca risorse: o perché il test alla fine non viene rifiutato o perché una dimensione del campione molto più piccola sarebbe stata sufficiente a respingere l'ipotesi.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.