Come visualizzare al meglio graficamente l'errore di tipo II (beta), la potenza e la dimensione del campione?


16

Mi viene chiesto di scrivere un'introduzione alle statistiche e sto lottando su come mostrare graficamente il rapporto tra valore p e potenza. Ho escogitato questo grafico:

Due curve di Gauss che interagiscono

La mia domanda: esiste un modo migliore per mostrarlo?

Ecco il mio codice R.

x <- seq(-4, 4, length=1000)
hx <- dnorm(x, mean=0, sd=1)

plot(x, hx, type="n", xlim=c(-4, 8), ylim=c(0, 0.5), 
ylab = "",
xlab = "",
main= expression(paste("Type II (", beta, ") error")), axes=FALSE)
axis(1, at = c(-qnorm(.025), 0, -4), 
     labels = expression("p-value", 0, -infinity ))

shift = qnorm(1-0.025, mean=0, sd=1)*1.7
xfit2 <- x + shift
yfit2 <- dnorm(xfit2, mean=shift, sd=1)

# Print null hypothesis area
col_null = "#DDDDDD"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null)
lines(x, hx, lwd=2)

# The alternative hypothesis area

## The red - underpowered area
lb <- min(xfit2)
ub <- round(qnorm(.975),2)
col1 = "#CC2222"

i <- xfit2 >= lb & xfit2 <= ub
polygon(c(lb,xfit2[i],ub), c(0,yfit2[i],0), col=col1)

## The green area where the power is
col2 = "#22CC22"
i <- xfit2 >= ub
polygon(c(ub,xfit2[i],max(xfit2)), c(0,yfit2[i],0), col=col2)

# Outline the alternative hypothesis
lines(xfit2, yfit2, lwd=2)

axis(1, at = (c(ub, max(xfit2))), labels=c("", expression(infinity)), 
    col=col2, lwd=1, lwd.tick=FALSE)


legend("topright", inset=.05, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), horiz=FALSE)

abline(v=ub, lwd=2, col="#000088", lty="dashed")

arrows(ub, 0.45, ub+1, 0.45, lwd=3, col="#008800")
arrows(ub, 0.45, ub-1, 0.45, lwd=3, col="#880000")

Aggiornare


Grazie per le fantastiche risposte. Ho cambiato parte del codice:

# Print null hypothesis area
col_null = "#AAAAAA"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null, lwd=2, density=c(10, 40), angle=-45, border=0)
lines(x, hx, lwd=2, lty="dashed", col=col_null)

...
legend("topright", inset=.015, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), 
       angle=-45,
       density=c(20, 1000, 1000), horiz=FALSE)

Mi piace il quadro tratteggiato, leggermente vago dell'ipotesi nulla perché segnala che non è veramente lì. Ho pensato alla trasparenza e all'aggiunta dell'alfa, ma mi preoccupo di ottenere troppe informazioni in un'unica immagine e quindi ho scelto di non farlo.

inserisci qui la descrizione dell'immagine

I limiti degli articoli stampati non mi permettono di fare esperimenti con i lettori. Ho scelto la risposta di @Greg Snow con TeachingDemos come risposta poiché amo l'idea con i due errori che non si sovrappongono.


4
È possibile migliorare leggermente il grafico utilizzando la pseudo-trasparenza. Qualcosa di simile a questa risposta .
Caracal,

@caracal (+1) Avrei dovuto aggiungere uno schema a tratteggio (come te) per l'area che mostra potenza.
chl

È bello, ho visto trame simili altrove. Ma questo non mostra i valori effettivi di più valori p e la potenza a quei valori p. Potresti calcolare la potenza per diversi valori di p e dimensioni del campione e quindi mettere più linee su un grafico
Peter Flom - Ripristina Monica

1
Forse verificare come i tipi di grafici generati dal software G * Power 3 sarebbero utili per le idee su cosa tracciare. Anche se dalla memoria sembrano molto simili a ciò che chl e caracal hanno già presentato (e non ti aiuterebbero a farlo in R).
Andy W,

@Andy G * La potenza ispirata al potere contro i grafici delle dimensioni dell'effetto o il potere contro i diagrammi alfa sarebbe davvero una bella aggiunta. Per il primo caso, un inizio potrebbe essere questa risposta , che dovrebbe essere facilmente adattabile al secondo caso.
Caracal,

Risposte:


9

Ho giocato con trame simili e ho scoperto che funziona meglio quando le 2 curve non si bloccano a vicenda, ma sono piuttosto sfalsate verticalmente (ma sempre sullo stesso asse x). Ciò chiarisce che una delle curve rappresenta l'ipotesi nulla e l'altra rappresenta un dato valore per la media sotto l'ipotesi alternativa. La power.exampfunzione nel pacchetto TeachingDemos per R creerà questi grafici e la run.power.exampfunzione (stesso pacchetto) consente di modificare interattivamente gli argomenti e aggiornare il diagramma.


+1, un'illustrazione più completa della mia. (In realtà, sapevo che c'era qualcosa nel TeachingDemospacchetto, ma era troppo pigro per cercarlo.)
chl

14

Alcuni pensieri: (a) Usa la trasparenza e (b) Consenti una certa interattività.

Ecco la mia opinione, ampiamente ispirata a un'applet Java sugli errori di tipo I e di tipo II - Errori nel sistema giudiziario . Poiché questo è un codice di disegno piuttosto puro, l'ho incollato come gist # 1139310 .

Ecco come appare:

inserisci qui la descrizione dell'immagine

H0


È davvero fantastico, non avevo mai visto un pacchetto prima d'ora.
Ken Williams,

1
@Ken Grazie. Il aplpackpacchetto ha anche alcuni buoni componenti aggiuntivi per i dati vale a dire. Tuttavia, il rpanel , che si basa anche su tcl / tk, è probabilmente un'opzione migliore per cose più complesse. Ora, con RStudio e il pacchetto manipola , è anche facile migliorare la trama di base in R.
chl

8

G Power 3 , software gratuito disponibile su Mac e Windows, ha alcune funzioni grafiche molto utili per l'analisi della potenza. Il grafico principale è sostanzialmente coerente con il tuo grafico e quello mostrato da @chl. Utilizza una semplice linea retta per indicare ipotesi nulla e distribuzioni statistiche test di ipotesi alternative e colori in beta e alfa in colori separati.

Una caratteristica interessante di G Power 3 è che supporta un gran numero di scenari comuni di analisi della potenza e la GUI semplifica l'esplorazione di studenti e ricercatori applicati.

Ecco una schermata di una diapositiva (tratta da una presentazione che ho dato su statistiche descrittive con una sezione sull'analisi della potenza ) con più di questi grafici mostrati a sinistra. Se scegli una versione t-test a una coda, sembrerebbe più simile al tuo esempio.

g power 3 grafici

È anche possibile produrre grafici che mostrano la relazione funzionale tra fattori rilevanti per la potenza statistica e test di ipotesi (ad es. Alfa, dimensione dell'effetto, dimensione del campione, potenza, ecc.). Vi presento alcuni esempi di tali grafici qui . Ecco un esempio di tale grafico:

inserisci qui la descrizione dell'immagine


Pacchetto interessante, lo esaminerò in futuro. I grafici sembrano un po 'complicati per qualcuno che non conosce il campo. Il mio pubblico è MD senza alcuna conoscenza di base matematica o statistica. Grazie!
Max Gordon,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.