Sto cercando vari modi per spiegare ai miei studenti (in un corso di statistica elementare) cos'è un test a due code e come viene calcolato il suo valore P.
Come spieghi ai tuoi studenti il test a due a una coda?
Sto cercando vari modi per spiegare ai miei studenti (in un corso di statistica elementare) cos'è un test a due code e come viene calcolato il suo valore P.
Come spieghi ai tuoi studenti il test a due a una coda?
Risposte:
Questa è un'ottima domanda e non vedo l'ora che tutti spieghino il valore p e il test a due code vs a una coda. Ho insegnato le statistiche ai colleghi chirurghi ortopedici e quindi ho cercato di mantenerlo il più basilare possibile poiché la maggior parte di loro non ha fatto matematica avanzata per 10-30 anni.
Comincio con una spiegazione del fatto che se crediamo di avere una moneta giusta sappiamo che dovrebbe finire in media con il 50% dei salti mortali ( ). Ora, se ti chiedi quale sia la probabilità di ottenere solo 2 code su 10 lanci con questa moneta giusta puoi calcolare quella probabilità come ho fatto nel grafico a barre. Dal grafico si può vedere che la probabilità di ottenere 8 lanci su 10 con una moneta giusta è di circa ≈ 4,4 % .
Dato che metteremmo in dubbio l'equità della moneta se avessimo 9 o 10 code, dobbiamo includere queste possibilità, la coda del test. Aggiungendo i valori otteniamo che la probabilità ora è un po 'più del di ottenere 2 code o meno.
Dato che noi in medicina di solito siamo interessati a studiare i fallimenti, dobbiamo includere il lato opposto della probabilità, anche se il nostro intento è fare del bene e introdurre un trattamento benefico.
Questo semplice esempio mostra anche quanto dipendiamo dall'ipotesi nulla per calcolare il valore p. Mi piace anche sottolineare la somiglianza tra la curva binomiale e la curva a campana. Quando si passa a 200 lanci si ottiene un modo naturale di spiegare perché la probabilità di ottenere esattamente 100 lanci inizia a non avere rilevanza. Gli intervalli di definizione di interesse sono una transizione naturale verso le funzioni di densità di densità / funzione di massa e le loro controparti cumulative.
Nella mia classe raccomando loro i video statistici dell'accademia di Khan e uso anche alcune delle sue spiegazioni per alcuni concetti. Arrivano anche a lanciare monete dove guardiamo nella casualità del lancio delle monete - la cosa che provo a mostrare è che la casualità è più casuale di quanto crediamo di solito ispirato da questo episodio di Radiolab .
Di solito ho un grafico / diapositiva, il codice R che ho usato per creare il grafico:
library(graphics)
binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0,
col=c("green", "gold", "red")){
barplot(
dbinom(0:x_max, x_max, my_prob)*100,
col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
#names=0:x_max,
ylab="Probability %",
xlab="Number of tails", names.arg=0:x_max)
if (my_title != FALSE ){
title(main=my_title)
}
}
binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))
Supponiamo di voler testare l'ipotesi che l'altezza media degli uomini sia "5 ft 7 pollici". Seleziona un campione casuale di uomini, misura le loro altezze e calcola la media del campione. La tua ipotesi quindi è:
Nella situazione precedente si esegue un test a due code poiché si rifiuta il valore null se la media del campione è troppo bassa o troppo alta.
In questo caso, il valore p rappresenta la probabilità di realizzare una media campionaria almeno altrettanto estrema come quella che abbiamo effettivamente ottenuto supponendo che il nulla sia effettivamente vero. Pertanto, se si osserva che la media del campione è "5 ft 8 pollici", il valore p rappresenterà la probabilità che osserveremo altezze superiori a "5 ft 8 pollici" o altezze inferiori a "5 ft 6 pollici" a condizione che il valore null è vero.
Se d'altra parte la tua alternativa è stata inquadrata in questo modo:
Nella situazione sopra avresti un test con una coda sul lato destro. Il motivo è che preferiresti rifiutare il null a favore dell'alternativa solo se la media del campione è estremamente alta.
L'interpretazione del valore p rimane invariata con la leggera sfumatura che stiamo ora parlando della probabilità di realizzare una media campionaria che è maggiore di quella che abbiamo effettivamente ottenuto. Pertanto, se osservare il campione significa essere "5 ft 8 pollici", il valore p rappresenterà la probabilità che osserveremo altezze superiori a "5 ft 8 pollici" purché il valore nullo sia vero.