In effetti, anche i valori p sono finalmente "fuori moda": http://www.nature.com/news/psychology-journal-bans-p-values-1.17001 . Il test di significatività dell'ipotesi nulla (NHST) produce poco più di una descrizione della dimensione del campione. (*) Qualsiasi intervento sperimentale avrà qualche effetto, vale a dire che la semplice ipotesi nulla di "nessun effetto" è sempre falsa in senso stretto . Pertanto, un test "non significativo" significa semplicemente che la dimensione del campione non era abbastanza grande; un test "significativo" significa che hai raccolto dati sufficienti per "trovare" qualcosa.
La "dimensione dell'effetto" rappresenta un tentativo di porre rimedio a questo, introducendo una misura sulla scala naturale del problema. In medicina, dove i trattamenti hanno sempre un certo effetto (anche se si tratta di un effetto placebo), viene introdotta la nozione di "effetto clinicamente significativo" per evitare la probabilità del 50% che un "trattamento" sia trovato "( statisticamente) significativo effetto positivo (comunque minuscolo) in uno studio arbitrariamente ampio.
Se capisco la natura del tuo lavoro, Clarinetist, alla fine della giornata, il suo scopo legittimo è quello di informare azioni / interventi che migliorano l'istruzione nelle scuole di tua competenza. Pertanto, l'impostazione è teorica della decisione e i metodi bayesiani sono l' approccio più appropriato (e unicamente coerente [1] ).
In effetti, il modo migliore per comprendere i metodi frequentisti è come approssimazioni ai metodi bayesiani . La dimensione stimata dell'effetto può essere intesa come mirante a una misura di centralità per la distribuzione posteriore bayesiana , mentre il valore p può essere inteso come mirato a misurare una coda di quella posteriore. Pertanto, insieme queste due quantità contengono un po 'di sostanza approssimativa del posteriore bayesiano che costituisce l'input naturale per una visione teorica-decisiva del tuo problema. (In alternativa, un intervallo di confidenza frequentista sulla dimensione dell'effetto può essere inteso allo stesso modo come un intervallo credibile aspirante .)
Nel campo della psicologia e dell'educazione, i metodi bayesiani sono in realtà piuttosto popolari. Uno dei motivi è che è facile installare "costrutti" nei modelli bayesiani, come variabili latenti. Potresti dare un'occhiata a "il libro dei cuccioli" di John K. Kruschke , uno psicologo. Nell'istruzione (in cui gli studenti sono nidificati nelle aule, nidificati nelle scuole, nidificati nei distretti, ...), la modellazione gerarchica è inevitabile. E i modelli bayesiani sono ottimi anche per la modellazione gerarchica. Su questo account, potresti dare un'occhiata a Gelman & Hill [2].
[1]: Robert, Christian P. La scelta bayesiana: dalle basi decisionale-teoriche all'implementazione computazionale. 2a ed. Testi Springer in Statistica. New York: Springer, 2007.
[2]: Gelman, Andrew e Jennifer Hill. Analisi dei dati mediante regressione e modelli multilivello / gerarchici. Metodi analitici per la ricerca sociale. Cambridge; New York: Cambridge University Press, 2007.
Per ulteriori informazioni sulla "coerenza" da una prospettiva non necessariamente pestata sulla testa con un mattone bayesiano , vedi [3].
[3]: Robins, James e Larry Wasserman. "Condizionamento, verosimiglianza e coerenza: una rassegna di alcuni concetti di base." Journal of American Statistical Association 95, n. 452 (1 dicembre 2000): 1340–46. DOI: 10,1080 / 01621459.2000.10474344.
(*) In [4], Meehl flagella NHST in modo molto più elegante, ma non meno abrasivo, di me:
Poiché l'ipotesi nulla è quasi sempre falsa, le tabelle che riassumono la ricerca in termini di modelli di "differenze significative" sono poco più che risultati complessi, causalmente non interpretabili delle funzioni di potere statistico.
[4]: Meehl, Paul E. "Rischi teorici e asterischi tabulari: Sir Karl, Sir Ronald e il lento progresso della psicologia dolce". Journal of Consulting and Clinical Psychiatry 46 (1978): 806–34. http://www3.nd.edu/~ghaeffel/Meehl(1978).pdf
Ed ecco una citazione correlata da Tukey: /stats//a/728/41404