Contesto
Un gruppo di scienziati e statistici sociali ( Benjamin et al., 2017 ) ha recentemente suggerito che il tipico tasso di falsi positivi ( = .05) usato come soglia per determinare "significatività statistica" deve essere adeguato a una soglia più conservativa ( = .005). Un gruppo in competizione di scienziati sociali e statistici ( Lakens et al., 2018 ) ha risposto, discutendo contro l'uso di questa o di qualsiasi altra soglia arbitrariamente selezionata. Quella che segue è una citazione di Lakens et al. (p. 16) che aiuta a esemplificare l'oggetto della mia domanda:
Idealmente, il livello alfa viene determinato confrontando costi e benefici con una funzione di utilità usando la teoria delle decisioni. Questa analisi costi-benefici (e quindi il livello alfa) differisce quando si analizzano grandi set di dati esistenti rispetto alla raccolta di dati da campioni difficili da ottenere. La scienza è varia e spetta agli scienziati giustificare il livello alfa che decidono di utilizzare. ... La ricerca dovrebbe essere guidata da principi di scienza rigorosa, non da euristica e soglie arbitrarie.
Domanda
Mi chiedo come si possa fare per giustificare l'alfa scelta in un modo "guidato da principi di scienza rigorosa", come Lakens et al. suggerire, nella maggior parte dei contesti di scienze sociali (cioè, al di fuori di casi selezionati in cui si ha una qualità più concreta, come il profitto, da ottimizzare)?
Dopo la diffusione di Lakens et al., Ho iniziato a vedere circolatori online per aiutare i ricercatori a prendere questa decisione. Quando li utilizzano, i ricercatori devono specificare un "rapporto di costo" di errori falsi positivi e falsi negativi. Tuttavia, come questa calcolatrice qui suggerisce, la determinazione di tale rapporto costi una può coinvolgere un sacco di indovinare-lavoro quantitativo:
Mentre alcuni costi di errore sono facili da quantificare in termini monetari (costi diretti), altri sono difficili da stabilire un importo dolar (costi indiretti). ... Nonostante sia difficile da quantificare, dovresti fare uno sforzo per mettergli un numero.
Ad esempio, sebbene Lakens et al. suggerisce di studiare campioni difficili da raggiungere come un fattore che si potrebbe prendere in considerazione per giustificare l'alfa, sembra che si sia ancora lasciato indovinare quanto sia difficile raggiungere quel campione e, quindi, come regolare di conseguenza la selezione dell'alfa. Come altro esempio, mi sembrerebbe difficile quantificare il costo della pubblicazione di un falso positivo, in termini di quanto tempo / denaro gli altri si impegnerebbero successivamente a perseguire la ricerca fondata sull'inferenza errata.
Se determinare questo rapporto di costo è in gran parte una questione di ipotesi soggettive, mi chiedo se queste decisioni possano mai (di nuovo, al di fuori dell'ottimizzazione di qualcosa come il profitto) essere "giustificate". Cioè, in un modo che esiste al di fuori delle ipotesi fatte su campionamento, compromessi, impatto, ecc.? In questo modo, determinare un rapporto di costo di errori falsi positivi / falsi negativi mi sembra qualcosa di simile alla selezione di un precedente nell'inferenza bayesiana - una decisione che può essere in qualche modo soggettiva, influenzare i risultati e quindi dibattuta- -sebbene non sia sicuro che sia un confronto ragionevole.
Sommario
Per rendere concreta la mia richiesta:
- I tassi di falsi positivi / falsi negativi e i loro rapporti di costo possono mai essere "rigorosamente" giustificati nella maggior parte dei contesti di scienze sociali?
- In tal caso, quali sono i principi generalizzabili che uno potrebbe seguire per giustificare queste scelte analitiche (e forse un esempio o due di esse in azione)
- In caso contrario, la mia analogia con la soggettività potenziale nella scelta dei rapporti di costo - come affine alla precedente selezione bayesiana - è ragionevole?
Riferimenti
Benjamin, DJ, Berger, J., Johannesson, M., Nosek, BA, Wagenmakers, E., ... Johnson, V. (2017, 22 luglio). Ridefinire il significato statistico. Estratto da psyarxiv.com/mky9j
Lakens, D., Adolfi, FG, Albers, CJ, Anvari, F., Apps, MA, ... Zwaan, RA (2018, 15 gennaio). Giustifica la tua alfa. Estratto da psyarxiv.com/9s3y6