Ci sono due tentativi di fare esattamente ciò che hai detto nella storia statistica, il bayesiano e il fiduciario. RA Fisher ha fondato due scuole di pensiero statistico, la scuola Likelihoodist costruita attorno al metodo della massima verosimiglianza e la Fiducial, che si è conclusa con un fallimento ma che tenta di fare esattamente quello che vuoi.
La risposta breve al perché fallì è che le sue distribuzioni di probabilità non finirono per integrarsi con l'unità. La lezione, alla fine, è stata che la probabilità precedente è una cosa necessaria per creare ciò che stai cercando di creare. In effetti, stai seguendo il percorso di uno dei più grandi statistici della storia e più di alcuni altri grandi sono morti nella speranza di una soluzione a questo problema. Se fosse trovato, metterebbe i metodi di ipotesi nulla alla pari dei metodi bayesiani in termini di tipi di problemi che potrebbero risolvere. In effetti, spingerebbe oltre Bayes, tranne laddove esistessero informazioni reali reali.
Vuoi anche stare attento con la tua affermazione che un valore p indica una maggiore probabilità per l'alternativa. Questo è vero solo nella scuola di Likelihoodist dei pescatori. Non è affatto vero nella scuola frequentista di Pearson-Neyman. La tua scommessa in basso sembra essere una scommessa di Pearson-Neyman mentre il tuo valore p è incompatibile in quanto proviene dalla scuola dei pescatori.
Per essere caritatevole, suppongo che, per il tuo esempio, non vi siano errori di pubblicazione e quindi solo i risultati significativi compaiono nelle riviste che creano un alto tasso di scoperte false. Lo sto trattando come un campione casuale di tutti gli studi effettuati, indipendentemente dai risultati. Direi che le tue probabilità di scommessa non sarebbero coerenti nel senso classico della parola de Finetti.
Nel mondo di De Finetti, una scommessa è coerente se il bookmaker non può essere giocato dai giocatori in modo che affrontino una perdita certa. Nella costruzione più semplice, è come la soluzione al problema del taglio della torta. Una persona taglia il pezzo a metà, ma l'altra persona sceglie quale pezzo desidera. In questa costruzione, una persona indicherebbe i prezzi delle scommesse su ciascuna ipotesi, ma l'altra persona sceglierebbe di acquistare o vendere la scommessa. In sostanza, potresti vendere allo scoperto il null. Per essere ottimali, le probabilità dovrebbero essere rigorosamente giuste. I valori di P non portano a probabilità eque.
Per illustrare questo, si consideri lo studio di Wetzels, et al su http://ejwagenmakers.com/2011/WetzelsEtAl2011_855.pdf
La citazione per cui è: Ruud Wetzels, Dora Matzke, Michael D. Lee, Jeffrey N. Rounder, Geoffrey J. Iverson ed Eric-Jan Wagenmakers. Prove statistiche in psicologia sperimentale: un confronto empirico con test a 855 t. Prospettive di scienze psicologiche. 6 (3) 291-298. 2011
Questo è un confronto diretto di 855 test t pubblicati utilizzando i fattori di Bayes per aggirare il problema della distribuzione precedente. Nel 70% dei valori di p compresi tra .05 e .01, i fattori di Bayes erano nella migliore delle ipotesi aneddotici. Ciò è dovuto alla forma matematica utilizzata dai frequentisti per risolvere il problema.
I metodi di ipotesi nulla presumono che il modello sia vero e per loro costruzione utilizzano una distribuzione statistica minimax anziché una distribuzione di probabilità. Entrambi questi fattori influiscono sulle differenze tra soluzioni bayesiane e non bayesiane. Considera uno studio in cui il metodo bayesiano valuta la probabilità posteriore di un'ipotesi come tre percento. Immagina che il valore p sia inferiore al cinque percento. Entrambi sono veri poiché il tre percento è inferiore al cinque percento. Tuttavia, il valore p non è una probabilità. Indica solo il valore massimo che potrebbe essere la probabilità di vedere i dati, non la probabilità effettiva che un'ipotesi sia vera o falsa. In effetti, sotto la costruzione del valore p, non è possibile distinguere tra effetti dovuti al caso con un valore nullo reale e un valore nullo falso con dati validi.
Se osservi lo studio Wetzel, noterai che è molto ovvio che le probabilità implicite dai valori p non corrispondono alle probabilità implicite dalla misura bayesiana. Poiché la misura bayesiana è sia ammissibile che coerente e il non bayesiano non è coerente, non è sicuro assumere la mappa dei valori p con le vere probabilità. Il presupposto forzato che il null sia valido fornisce buone probabilità di copertura, ma non produce buone probabilità di gioco.
Per avere una migliore idea del perché, considera il primo assioma di Cox secondo cui la plausibilità di un'ipotesi può essere descritta da un numero reale. Implicitamente, ciò significa che tutte le ipotesi hanno un numero reale legato alla loro plausibilità. Nei metodi di ipotesi null, solo il null ha un numero reale legato alla sua plausibilità. L'ipotesi alternativa non ha fatto misurazioni e non è certamente il complemento alla probabilità di osservare i dati dato che il valore nullo è vero. Infatti, se il valore nullo è vero, allora il complemento è falso per ipotesi senza riguardo ai dati.
Se costruissi le probabilità usando i valori p come base della tua misura, allora il bayesiano usando le misure bayesiane sarebbe sempre in grado di ottenere un vantaggio su di te. Se il bayesiano stabilisse le probabilità, la teoria delle decisioni di Pearson e Neyman fornirebbe una dichiarazione di scommessa o non scommetterebbe, ma non sarebbero in grado di definire l'importo da scommettere. Poiché le probabilità bayesiane erano giuste, il guadagno atteso dall'uso del metodo di Pearson e Neyman sarebbe zero.
In effetti, lo studio Wetzel è proprio quello di cui stai parlando, ma con 145 scommesse in meno. Se guardi la tabella tre, vedrai alcuni studi in cui il frequentista rifiuta il nulla, ma il bayesiano scopre che la probabilità favorisce il nulla.