regolazione del valore p per la statistica I di Moran locale (LISA)


10

Sto lavorando con alcune analisi spaziali esplorative in R usando il pacchetto spdep.

Mi sono imbattuto in un'opzione per regolare i valori p degli indicatori locali di associazione spaziale (LISA) calcolati usando la localmoranfunzione. Secondo i documenti si rivolge a:

... regolazione del valore di probabilità per più test.

Inoltre nei documenti di p.adjustSPho letto che le opzioni disponibili sono:

I metodi di regolazione comprendono la correzione di Bonferroni ('"bonferroni"') in cui i valori di p sono moltiplicati per il numero di confronti. Quattro correzioni meno conservative sono incluse anche da Holm (1979) ('"holm"'), Hochberg (1988) ('"hochberg"'), Hommel (1988) ('"hommel"') e Benjamini & Hochberg (1995) ('"fdr"'), rispettivamente. È inclusa anche un'opzione pass-through ('"none"').

I primi quattro metodi sono progettati per fornire un forte controllo del tasso di errore a livello familiare. Non sembra esserci alcun motivo per utilizzare la correzione non modificata di Bonferroni perché è dominata dal metodo di Holm, che è anche valido sotto ipotesi arbitrarie.

I metodi di Hochberg e Hommel sono validi quando i test di ipotesi sono indipendenti o quando sono associati in modo non negativo (Sarkar, 1998; Sarkar e Chang, 1997). Il metodo di Hommel è più potente di quello di Hochberg, ma la differenza è generalmente piccola e i valori p di Hochberg sono più veloci da calcolare.

Il metodo "BH" (aka "fdr") e "BY" di Benjamini, Hochberg e Yekutieli controllano il tasso di false scoperte, la percentuale attesa di false scoperte tra le ipotesi respinte. Il tasso di rilevamento falso è una condizione meno rigorosa rispetto al tasso di errore familiare, quindi questi metodi sono più potenti degli altri.

Un paio di domande che sono comparse:

  1. In parole povere: qual è lo scopo di questo adattamento?
  2. È necessario utilizzare tali correzioni?
  3. Se sì, come scegliere tra le opzioni disponibili?

1
Ho migrato questa domanda perché molti come loro sono stati affrontati qui sul CV. Scopri cosa puoi imparare da una ricerca , ad esempio.
whuber

@whuber Buona idea. Non ho pensato al CV, ma in effetti sembra essere una casa migliore per questo. Grazie.
radek,

Risposte:


1

in breve, il problema che stai affrontando si chiama test di ipotesi multiple . Sorge quando si stanno testando, come indica il nome, molte ipotesi contemporaneamente.

Diciamo che hai una determinata probabilità di rifiutare erroneamente l'ipotesi nulla (falso positivo) per un test, diciamo 5%. Man mano che aumenti il ​​numero di set di dati che stai testando (in questo caso, ciascuno dei set in cui applichi la statistica Moran locale), aumenterà la probabilità di osservare in qualsiasi set di dati un falso positivo, indipendentemente dal fatto che la probabilità di osservare un falso positivo per un singolo set di dati è lo stesso.

Esistono molte "correzioni" possibili, che sono state trovate, per correggere questo problema; se hai davvero bisogno di una statistica locale, non puoi schivarla. Altrimenti, è possibile utilizzare la statistica globale come singola ipotesi.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.