Quindi, questa potrebbe essere una domanda comune, ma non ho mai trovato una risposta soddisfacente.
Come si determina la probabilità che l'ipotesi nulla sia vera (o falsa)?
Supponiamo che tu dia agli studenti due diverse versioni di un test e desideri vedere se le versioni erano equivalenti. Esegui un test t che fornisce un valore p di 0,02. Che bel valore p! Ciò significa che è improbabile che i test siano equivalenti, giusto? No. Sfortunatamente, sembra che P (risultati | null) non ti dica P (null | risultati). La cosa normale da fare è rifiutare l'ipotesi nulla quando incontriamo un basso valore p, ma come facciamo a sapere che non stiamo respingendo un'ipotesi nulla che è probabilmente vera? Per fare un esempio sciocco, posso progettare un test per ebola con un tasso di falsi positivi di 0,02: metti 50 palline in un secchio e scrivi "ebola" su una. Se collaudo qualcuno con questo e scelgono la palla "ebola", il valore p (P (scegliendo la palla | non hanno ebola)) è .02,
Cose che ho considerato finora:
- Supponendo P (null | results) ~ = P (results | null) - chiaramente falso per alcune importanti applicazioni.
- Accettare o rifiutare l'ipotesi senza conoscere P (null | results) - Perché le accettiamo o le rifiutiamo allora? Non è vero che rifiutiamo ciò che pensiamo sia PROBABILE falso e accettiamo ciò che è VERAMENTE vero?
- Usa il teorema di Bayes - Ma come ottieni i tuoi priori? Non torni nello stesso posto cercando di determinarli sperimentalmente? E raccoglierli a priori sembra molto arbitrario.
- Ho trovato una domanda molto simile qui: stats.stackexchange.com/questions/231580/. L'unica risposta qui sembra fondamentalmente dire che non ha senso chiedere la probabilità che un'ipotesi nulla sia vera poiché si tratta di una domanda bayesiana. Forse sono un bayesiano nel cuore, ma non riesco a immaginare di non fare quella domanda. In effetti, sembra che il più comune fraintendimento dei valori di p sia che sono la probabilità di una vera ipotesi nulla. Se davvero non puoi fare questa domanda come frequentatore, allora la mia domanda principale è # 3: come puoi ottenere i tuoi priori senza rimanere bloccati in un ciclo?
Modifica: grazie per tutte le risposte ponderate. Voglio affrontare un paio di temi comuni.
- Definizione di probabilità: sono sicuro che ci sia molta letteratura su questo, ma la mia idea ingenua è qualcosa come "la convinzione che un essere perfettamente razionale avrebbe fornito le informazioni" o "le probabilità di scommessa che massimizzerebbero il profitto se la situazione fu ripetuto e le incognite furono lasciate variare ".
- Possiamo mai conoscere P (H0 | risultati)? Certamente, questa sembra essere una domanda difficile. Credo, tuttavia, che ogni probabilità sia teoricamente conoscibile, poiché la probabilità è sempre subordinata alle informazioni fornite. Ogni evento accadrà o non accadrà, quindi la probabilità non esiste con informazioni complete. Esiste solo quando non ci sono informazioni sufficienti, quindi dovrebbe essere conoscibile. Ad esempio, se mi viene detto che qualcuno ha una moneta e chiede la probabilità delle teste, direi il 50%. Può succedere che la moneta abbia un peso del 70% sulle teste, ma non mi è stata data quell'informazione, quindi la probabilità era del 50% per le informazioni che avevo, proprio come se dovesse capitare su code, la probabilità era del 70% capisce quando l'ho imparato. Poiché la probabilità è sempre subordinata a un insieme di dati (insufficienti),
Modifica: "Sempre" potrebbe essere un po 'troppo forte. Potrebbero esserci alcune domande filosofiche per le quali non possiamo determinare la probabilità. Tuttavia, nelle situazioni del mondo reale, mentre non possiamo "quasi mai" avere la certezza assoluta, ci dovrebbe essere "quasi sempre" una migliore stima.