Qual è la formula per il valore p corretto di Benjamini-Hochberg?


14

Capisco la procedura e ciò che controlla. Quindi qual è la formula per il valore p corretto nella procedura BH per confronti multipli?


Proprio ora ho capito che il BH originale non produceva valori p regolati, ma solo le condizioni di (non) rifiuto: https://www.jstor.org/stable/2346101 . Gordon Smyth ha introdotto comunque i valori p di BH modificati nel 2002, quindi la domanda è ancora valida. È implementato in R come p.adjustcon il metodo BH.

Risposte:


6

Il famoso seminario Benjamini & Hochberg (1995) descriveva la procedura per accettare / rifiutare le ipotesi sulla base della regolazione dei livelli alfa. Questa procedura ha una semplice riformulazione equivalente in termini di valori p adeguati, ma non è stata discussa nel documento originale. Secondo Gordon Smyth , ha introdotto valori p adattati nel 2002 durante l'implementazione p.adjustin R. Sfortunatamente, non esiste una citazione corrispondente, quindi non mi è sempre stato chiaro cosa si dovrebbe citare se si utilizzano valori p regolati da BH.

Si scopre che la procedura è descritta nel Benjamini, Heller, Yekutieli (2009) :

Un modo alternativo di presentare i risultati di questa procedura è presentare i valori p adeguati. I valori p regolati da BH sono definiti come

p(i)BH=min{minji{mp(j)j},1}.

Questa formula sembra più complicata di quanto non sia in realtà. Dice:

  1. Per prima cosa, ordina tutto pvalori p da piccoli a grandi. Quindi moltiplicare ciascun valorep per il numero totale di testm dividere per il suo ordine di classificazione.
  2. In secondo luogo, assicurarsi che la sequenza risultante non sia decrescente: se mai inizia a diminuire, rendere il valore p precedente uguale al successivo (ripetutamente, fino a quando l'intera sequenza diventa non decrescente).
  3. Se qualche valore p finisce per essere maggiore di 1, rendilo uguale a 1.

Questa è una semplice riformulazione della procedura BH originale dal 1995. Potrebbe esistere un documento precedente che ha introdotto esplicitamente il concetto di valori p aggiustati per BH, ma non ne sono a conoscenza.


Aggiornare.@Zenit ha scoperto che Yekutieli e Benjamini (1999) hanno descritto la stessa cosa già nel 1999:

inserisci qui la descrizione dell'immagine


Questa è la risposta che mi aspettavo, +1. Ricordo di aver letto dell'implementazione di Gordon Smyth del valore p corretto e di non sapere chi citare, bello vedere che c'è una citazione "canonica" in questo.
Firebug

1
Credo che esista un riferimento ancora precedente: Yekutieli e Benjamini (1999) (versione pdf disponibile qui ). La definizione 2.4 descrive come la procedura FDR originale del 1995 può essere riformulata in termini di valori p adeguati. Ringrazio questo post sul blog dove ho scoperto questo.
Zenit,

@Zenit Oh wow! Grande scoperta! Dovrei aggiornare la mia risposta.
ameba dice che ripristini Monica il

Grazie per la fonte @Zenit! È leggermente strano come un metodo statistico così onnipresente non abbia un riferimento ben noto.
Firebug,

8

p0pz0N0 p0N

  • FDR (p0)=p0N0N

  • FDR (pio)=min(FDR(pio),FDR(pio+1))


Ora capiamo questo. L'idea alla base (bayesiana) è che le osservazioni provengono da una miscela di due distribuzioni:

  • π0Nf0(z)
  • (1-π0)Nf1(z)

Ciò che si osserva è la miscela di quei due:

  • f(z)=π0f0(z)+(1-π0)f1(z)

inserisci qui la descrizione dell'immagine

Le definizioni (bayesiane) sono:

  • Fdr=π0(1-F0(z0))(1-F(z))
  • fdr=π0f0(z0)f(z) (una frazione della densità della coda)

π01

inserisci qui la descrizione dell'immagine

(Basato sull'inferenza statistica dell'era informatica di Efron e Tibshirani )

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.