Mentre sto leggendo il libro di Wassermann All of Statistics, noto una finezza nella definizione dei valori p, che non riesco a capire. Informalmente, Wassermann definisce il valore p come
[..] la probabilità (sotto ) di osservare un valore della statistica del test uguale o più estrema di quanto effettivamente osservato.
Enfasi aggiunta. Lo stesso in modo più formale (Teorema 10.12):
Supponiamo che il test size sia del modulo
respinge se e solo se . T ( X n ) ≥ c α
Poi,
dove è il valore osservato di . Se quindi
Inoltre, Wassermann definisce il valore p del test \ chi ^ 2 di Pearson (e altri test in modo analogo) come:
La parte che mi piace chiedere chiarimenti è il segno maggiore-uguale ( ) nella prima e il segno maggiore ( ) nella seconda definizione. Perché non scriviamo , che corrisponderebbe alla prima citazione di " uguale o più estrema?"
Questa pura comodità è tale da calcolare il valore p come ? Vedo che R usa anche la definizione con il segno , ad es . In .chisq.test