Poiché si possono calcolare gli intervalli di confidenza per i valori p e poiché l'opposto della stima dell'intervallo è la stima puntuale: il valore p è una stima puntuale?
Poiché si possono calcolare gli intervalli di confidenza per i valori p e poiché l'opposto della stima dell'intervallo è la stima puntuale: il valore p è una stima puntuale?
Risposte:
Le stime puntuali e gli intervalli di confidenza si riferiscono a parametri che descrivono la distribuzione, ad es. Media o deviazione standard.
A differenza di altre statistiche di esempio come la media del campione e la deviazione standard del campione, il valore p non è uno stimatore utile di un parametro di distribuzione interessante. Guarda la risposta di @whuber per i dettagli tecnici.
Il valore p per una statistica test dà la probabilità di osservare una deviazione dal valore atteso della statistica test tanto grande quanto osservato nel campione, calcolato partendo dal presupposto che l'ipotesi nulla sia vera. Se hai l'intera distribuzione, è coerente con l'ipotesi nulla o non lo è. Questo può essere descritto con una variabile indicatore (di nuovo, vedi la risposta di @whuber).
Ma il valore p non può essere usato come utile stimatore della variabile indicatore perché non è coerente in quanto il valore p non converge all'aumentare della dimensione del campione se l'ipotesi nulla è vera. Questo è un modo alternativo piuttosto complicato per affermare che un test statistico può rifiutare o non rifiutare il null, ma non confermarlo mai.
Sì, si potrebbe (ed è stato) sostenuto che un valore p è una stima puntuale.
Per identificare qualunque proprietà di una distribuzione possa stimare un valore p, dovremmo presumere che sia asintoticamente imparziale. Ma, asintoticamente, il valore p medio per l'ipotesi nulla è (idealmente; per alcuni test potrebbe essere un altro numero diverso da zero) e per qualsiasi altra ipotesi è . Pertanto, il valore p potrebbe essere considerato uno stimatore della metà della funzione indicatore per l'ipotesi nulla.0
Sebbene sia interessante esplorare i limiti (e le limitazioni) di tali definizioni, come questa domanda ci invita a fare, forse non dovremmo insistere troppo sul fatto che un valore p è uno stimatore puntuale, perché questa distinzione tra stimatori e test è sia utile e convenzionale.
In un commento a questa domanda, Christian Robert ha richiamato l'attenzione su un articolo del 1992 in cui lui e i suoi coautori hanno preso esattamente questo punto di vista e analizzato l'ammissibilità del valore p come stimatore della funzione indicatore . Vedi il link nei riferimenti seguenti. Il documento inizia,
Gli approcci ai test di ipotesi hanno generalmente trattato il problema dei test come un processo decisionale piuttosto che una stima. Più precisamente, un test di ipotesi formale porterà a una conclusione sulla validità di un'ipotesi e non fornirà una misura di prova da associare a tale conclusione. In questo articolo consideriamo il test delle ipotesi come un problema di stima all'interno di un quadro decisionale ...
[Enfasi aggiunta.]
Jiunn Tzon Hwang, George Casella, Christian Robert, Martin T. Wells e Roger H. Farrell, Stima dell'accuratezza nei test . Ann. Statist. Volume 20, numero 1 (1992), 490-509. Accesso aperto .
Jack Carl Kiefer, Introduzione all'inferenza statistica . Springer-Verlag, 1987.