Perché i nomi Tipo 1, errore 2?


21

Qual è la motivazione dell'introduzione di un ulteriore livello di riferimento indiretto dal "falso positivo" descrittivo all'intero "1"? Il "falso positivo" è davvero troppo lungo?


10
Sono con te, è un nome orribile. Colgo ogni occasione per non usarlo.
Matthew Drury,

5
Stesso. Non riuscivo mai a ricordare quale fosse, fino a quando non ho sentito questo modo incredibilmente utile di distinguerli ... Nella storia The Boy Who Cried Wolf , gli abitanti del villaggio hanno prima commesso un errore di tipo 1 , e la seconda volta hanno commesso un errore di tipo 2 .
Sam,

1
@Sam Li ricordo come in "La prima cosa che fa un ricercatore dopo aver scoperto un effetto è pubblicare". Ma nel riquadro a destra è presente un collegamento a una domanda con 84 voti positivi su come ricordarli.
Vorac,

Trovo sempre "falso positivo" e "falso negativo" molto confuso. In medicina "positivo" si riferisce ad "avere la condizione" (che è già fonte di confusione e fonte di molte battute) ma che tipo di test (statistico) viene utilizzato per determinare se hai la condizione? È positivo, avendo la condizione, uguale a un test rifiutato per la salubrità (ad esempio test per livelli salutari di alcuni componenti, ad esempio ferro nel sangue), o è uguale a un test non rifiutato per malattia (ad esempio test per marcatori che indicano la malattia, la condizione o qualcos'altro come la gravidanza)? H0H0
Sesto Empirico

Risposte:


21

Ottima domanda, mi ha motivato a Google :) Per Wikipedia (con modifiche di formattazione minori):

Un errore di tipo I (o errore del primo tipo) è il rifiuto errato di una vera ipotesi nulla.

Un errore di tipo II (o errore del secondo tipo) è l'incapacità di respingere una falsa ipotesi nulla.

Più in basso nella pagina viene discussa l'etimologia:

Nel 1928, Jerzy Neyman (1894–1981) e Egon Pearson (1895–1980), entrambi eminenti statistici, discutevano dei problemi associati a "decidere se un particolare campione potesse essere giudicato probabile che fosse stato estratto casualmente da una determinata popolazione "...

"... nel testare le ipotesi devono essere tenute in considerazione due considerazioni, (1) dobbiamo essere in grado di ridurre la possibilità di rifiutare una vera ipotesi al valore più basso desiderato; (2) il test deve essere concepito in modo tale che respingerà l'ipotesi verificata quando è probabile che sia falsa ".

Essi inoltre notato che, nel decidere se rifiutare sicuro, o rifiutare una particolare ipotesi tra un "set di ipotesi alternative", , ,. . ., è stato facile commettere un errore:H1H2

"... [e] questi errori saranno di due tipi:

  • (I) rifiutiamo [cioè l'ipotesi da verificare] quando è vero H0
  • (II) non rifiutiamo quando alcune ipotesi alternative o sono vere. "H0HAH1

    Nello stesso documento chiamano queste due fonti di errore, rispettivamente errori di tipo I ed errori di tipo II.

  • Quindi sembra che il primo tipo di errore fosse basato sul lavoro originale di Fisher sui test di significatività. Il secondo tipo di errore si basava sull'estensione di Neyman e Pearson del lavoro di Fisher, ovvero l'introduzione dell'ipotesi alternativa e quindi la verifica dell'ipotesi. Vedi qui per maggiori dettagli.

    Sembra che l'ordine in cui sono stati identificati questi tipi di errori corrisponda al loro numero, come indicato da Neyman e Pearson.


    1
    Ragioni storiche - non sorprende. Proprio come le <-macro di sostituzione del testo di R e C ++. Grazie per aver risposto alla mia domanda scarsamente ricercata. E grazie a @gung per la bella domanda modifica.
    Vorac,

    3
    "L'ordine in cui ci hanno pensato" non è stato fortemente influenzato dal precedente lavoro di Fisher? cioè fino a quando Neyman e Pearson hanno introdotto l'idea di un'ipotesi alternativa non vi è stato un solo "tipo" di errore (rifiutando H_0 quando è vero). Insieme a H_A arriva la possibilità di un errore "del secondo tipo".
    steeldriver,

    Sono sicuro che lo fosse.
    ilanman,

    Un piccolo punto che potrebbe essere utile aggiungere è che l'articolo del 1928 "Sull'uso e l'interpretazione di alcuni criteri di prova per scopi di inferenza statistica" non definisce ancora le diverse fonti di errore come errori di "tipo I" e "di tipo II" (invece parla di tipo ordinato in relazione alla distribuzione di Pearson). È nel 1933 che Neyman e Pearson lo definirono di tipo I e di tipo II.
    Sesto Empirico

    Sarebbe anche utile raddrizzare la citazione con riferimenti corretti. O almeno la prima citazione "... nel testare ipotesi due considerazioni ..." non è letteralmente dall'articolo del 1928.
    Sesto Empirico
    Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
    Licensed under cc by-sa 3.0 with attribution required.