So che ci sono molti materiali che spiegano il valore p. Tuttavia, il concetto non è facile da comprendere saldamente senza ulteriori chiarimenti.
Ecco la definizione di p-value da Wikipedia:
Il valore p è la probabilità di ottenere una statistica test almeno estrema quanto quella effettivamente osservata, supponendo che l'ipotesi nulla sia vera. ( http://en.wikipedia.org/wiki/P-value )
La mia prima domanda riguarda l'espressione "almeno estrema come quella che è stata effettivamente osservata". La mia comprensione della logica alla base dell'uso del valore p è la seguente: se il valore p è piccolo, è improbabile che l'osservazione si sia verificata assumendo l'ipotesi nulla e potremmo aver bisogno di un'ipotesi alternativa per spiegare l'osservazione. Se il valore p non è così piccolo, è probabile che l'osservazione si sia verificata solo assumendo l'ipotesi nulla e l'ipotesi alternativa non è necessaria per spiegare l'osservazione. Quindi, se qualcuno vuole insistere su un'ipotesi, deve dimostrare che il valore p dell'ipotesi nulla è molto piccolo. Con questa visione in mente, la mia comprensione dell'espressione ambigua è che il valore p è, se il PDF della statistica è unimodale, dove è la statistica del test e è il suo valore ottenuto dall'osservazione. È giusto? Se è giusto, è ancora applicabile usare il PDF bimodale della statistica? Se due picchi del PDF sono separati bene e il valore osservato si trova da qualche parte nella regione a bassa densità di probabilità tra i due picchi, quale intervallo dà il valore p?
La seconda domanda riguarda un'altra definizione di valore p da Wolfram MathWorld:
La probabilità che una variabile assuma per caso un valore maggiore o uguale al valore osservato. ( http://mathworld.wolfram.com/P-Value.html )
Ho capito che la frase "rigorosamente per caso" dovrebbe essere interpretata come "assumendo un'ipotesi nulla". È giusto?
La terza domanda riguarda l'uso di "ipotesi nulla". Supponiamo che qualcuno voglia insistere sul fatto che una moneta sia giusta. Esprime l'ipotesi in quanto la frequenza relativa delle teste è 0,5. Quindi l'ipotesi nulla è "la frequenza relativa delle teste non è 0,5". In questo caso, mentre il calcolo del valore p dell'ipotesi nulla è difficile, il calcolo è facile per l'ipotesi alternativa. Naturalmente il problema può essere risolto scambiando il ruolo delle due ipotesi. La mia domanda è che il rifiuto o l'accettazione basati direttamente sul valore p dell'ipotesi alternativa originale (senza introdurre l'ipotesi nulla) è se va bene o no. Se non è OK, qual è la solita soluzione per tali difficoltà nel calcolo del valore p di un'ipotesi nulla?
Ho pubblicato una nuova domanda che è più chiarita in base alla discussione in questo thread.