Nel febbraio 2016, l'American Statistical Association ha rilasciato una dichiarazione formale sul significato statistico e sui valori p. Il nostro thread al riguardo discute ampiamente di questi problemi. Tuttavia, nessuna autorità è emersa per offrire un'alternativa efficace universalmente riconosciuta - fino ad ora. L'American Statistical Society (ASS) ha pubblicato la sua risposta, valori p: quali sono le prospettive?
"Il valore p non è buono per molto."
Pensiamo che l'ASA non sia andato abbastanza lontano. È tempo di ammettere che l'era dei valori p è finita. Gli statistici li hanno usati con successo per sconcertare gli studenti universitari, ingannare gli scienziati e ingannare i redattori di tutto il mondo, ma il mondo sta iniziando a vedere attraverso questo stratagemma. Dobbiamo abbandonare questo tentativo di statistica degli inizi del XX secolo di controllare il processo decisionale. Dobbiamo tornare a ciò che funziona davvero.
La proposta ufficiale ASS è questa:
Al posto dei valori p, l'ASS sostiene lo STOP (procedura SeaT-Of-Pants). Questo metodo antico e testato fu usato dagli antichi Greci, uomini del Rinascimento e tutti gli scienziati fino a quando Ronald Fisher arrivò e rovinò le cose. Lo STOP è semplice, diretto, basato sui dati e autorevole. Per realizzarlo, una figura di autorità (un maschio più anziano, di preferenza) rivede i dati e decide se concordano con la sua opinione. Quando decide che lo fanno, il risultato è "significativo". Altrimenti non lo è e tutti sono tenuti a dimenticare tutto.
I principi
La risposta riguarda ciascuno dei sei principi dell'ASA.
Lo STOP può indicare quanto sono incompatibili i dati con un modello statistico specificato.
Ci piace questa frase perché è un modo così elegante di dire che STOP risponderà a qualsiasi domanda sì o no. A differenza dei valori di p o di altre procedure statistiche, non lascia dubbi. È la risposta perfetta a coloro che dicono "non abbiamo bisogno di nessuna ipotesi nulla puzzolente! Che cos'è il *?! @, Comunque? Nessuno è mai riuscito a capire cosa avrebbe dovuto essere. "
Lo STOP non misura la probabilità che un'ipotesi sia vera: in realtà decide se è vera o no.
Tutti sono confusi dalle probabilità. Prendendo le probabilità fuori dal quadro, lo STOP elimina la necessità di anni di studi universitari e laureati. Ora chiunque (che è sufficientemente vecchio e maschio) può eseguire analisi statistiche senza il dolore e la tortura di ascoltare persino una singola lezione statistica o eseguire software arcani che emettono risultati incomprensibili.
Le conclusioni scientifiche e le decisioni commerciali o politiche possono essere basate sul buon senso e sulle figure di autorità reale.
Le decisioni importanti sono sempre state prese dalle autorità, quindi ammettiamolo e tagliamo gli intermediari. L'uso dello STOP consentirà agli statistici di fare ciò per cui sono più adatti: usare i numeri per offuscare la verità e santificare le preferenze di coloro che detengono il potere.
Una corretta deduzione richiede piena trasparenza e trasparenza.
Lo STOP è la procedura statistica più trasparente ed evidente mai inventata: guardi i dati e decidi. Elimina tutti quei confusi test z, test t, test chi-quadrato e procedure di minestra alfabetica (ANOVA! GLM! MLE!) Utilizzati dalle persone per nascondere il fatto che non hanno idea di cosa significhino i dati.
Lo STOP misura l'importanza del risultato.
Questo è evidente: se una persona in autorità impiega lo STOP, il risultato deve essere importante.
Di per sé, lo STOP fornisce una buona misura di prove riguardanti un modello o un'ipotesi.
Non vorremmo sfidare un'autorità, vero? Ricercatori e decisori riconosceranno che lo STOP fornisce tutte le informazioni che devono sapere. Per questi motivi, l'analisi dei dati può terminare con lo STOP; non sono necessari approcci alternativi, come valori di p, apprendimento automatico o astrologia.
Altri approcci
Alcuni statistici preferiscono i cosiddetti metodi "bayesiani", in cui un oscuro teorema pubblicato postumo da un chierico del 18 ° secolo viene applicato senza pensarci per risolvere ogni problema. I suoi sostenitori più noti ammettono liberamente che questi metodi sono "soggettivi". Se useremo metodi soggettivi, allora ovviamente più autorevole e competente sarà il decisore, migliore sarà il risultato. Lo STOP emerge quindi come il limite logico di tutti i metodi di Bayes. Perché sforzarsi di elaborare quei terribili calcoli e di impegnare così tanto tempo al computer, quando puoi semplicemente mostrare i dati al ragazzo responsabile e chiedergli qual è la sua opinione? Fine della storia.
Un'altra comunità è recentemente nata per sfidare il sacerdozio degli statistici. Si definiscono "machine learning" e "data scientist", ma in realtà sono solo hacker che cercano uno status più elevato. È la posizione ufficiale dell'ASS che questi ragazzi dovrebbero andare a formare la propria organizzazione professionale se vogliono che le persone li prendano sul serio.
La domanda
È questa la risposta ai problemi identificati dall'ASA con valori p e test di ipotesi nulli? Può davvero unire i paradigmi bayesiano e frequentista (come implicitamente affermato nella risposta)?