Storia e origine
Secondo Robert D Cousins e Tommaso Dorigo , l'origine dell'origine della soglia risiede nei primi lavori di fisica delle particelle degli anni '60, quando furono esaminati numerosi istogrammi di esperimenti di scattering e cercarono picchi / dossi che potrebbe indicare alcune particelle scoperte di recente. La soglia è una regola approssimativa per tenere conto dei molteplici confronti che vengono effettuati.12 5σ25σ
Entrambi gli autori fanno riferimento a un articolo di Rosenfeld 1968 , che trattava la questione se esistessero o meno mesoni e barioni lontani, per i quali misurati diversi effetti . L'articolo ha risposto negativamente alla domanda sostenendo che il numero di richieste pubblicate corrisponde al numero statisticamente previsto di fluttuazioni. Insieme a diversi calcoli a supporto di questo argomento, l'articolo ha promosso l'uso del livello :34σ5σ
Rosenfeld: "Prima di continuare a esaminare spettri di massa lontani in cui sono stati segnalati dossi in
dovremmo prima decidere cosa soglia di significatività da richiedere nel 1968. Voglio mostrarti che sebbene gli sperimentatori dovrebbero probabilmente notare gli effetti , teorici e fenomenologi farebbero meglio ad aspettare che l'effetto raggiunga ".(Kππ)3/2,(πρ)−−3σ>4σ
e più avanti nel documento (l'enfasi è mia)
Rosenfeld: "Quindi ripetere il mio avvertimento all'inizio di questa sezione; stiamo generando almeno 100.000 potenziali dossi all'anno e dovremmo aspettarci diverse fluttuazioni di e centinaia di . Quali sono le implicazioni? Per il teorico o fenomenologo la morale è semplice; attendi gli effetti . "4σ3σ5 σ5σ
Tommaso sembra stare attento nel dichiarare che è iniziato con l'articolo di Rosenfeld
Tommaso: "Tuttavia, dovremmo notare che l'articolo è stato scritto nel 1968, ma il severo criterio di cinque deviazioni standard per i reclami di scoperta non è stato adottato negli anni settanta e ottanta. Ad esempio, non è stato usato nessun criterio come il cinque sigma per la scoperta dei bosoni W e Z, che hanno conferito a Rubbia e Van der Meer il premio Nobel per la fisica nel 1984. "
Ma negli anni '80 l'uso del fu diffuso. Ad esempio, l'astronomo Steve Schneider menziona nel 1989 che è qualcosa che viene insegnato (enfatizza il mio nella citazione seguente):5σ44
Schneider: "Spesso vengono citati" livelli di confidenza "del 95% o del 99% per dati apparentemente discrepanti, ma ciò equivale a solo due o tre sigmi statistici. Mi è stato insegnato a non credere a meno di cinque sigma , che se si pensa è un requisito assurdamente rigoroso --- qualcosa come un livello di confidenza del 99,9999%, ma ovviamente un tale limite viene usato perché la dimensione effettiva del sigma non è quasi mai conosciuta. Ci sono troppe variabili libere in astronomia che possiamo controlla o non lo so. "
Tuttavia, nel campo della fisica delle particelle molte pubblicazioni erano ancora basate su discrepanze di fino alla fine degli anni '90. Questo cambiò solo in all'inizio del 21 ° secolo. Probabilmente è prescritto come linea guida per le pubblicazioni intorno al 2003 (vedi il prologo nel libro di Franklin Shifting Standards )4σ5σ55
Franklin: Nel 2003 il criterio di 5 deviazioni standard per "l'osservazione di" sembra essere entrato in vigore
...
Un membro della collaborazione BaBar ricorda che in questo periodo il criterio 5-sigma è stato emesso come linea guida dagli editori delle Physical Review Letters
Uso moderno
Attualmente, la soglia è uno standard da manuale. Ad esempio, si presenta come un articolo standard su physics.org o in alcune delle opere di Glen Cowan, come la sezione delle statistiche di Review of Particle Physics dal gruppo di dati delle particelle (sebbene con diversi sidenotes critici)5σ6 767
Glen Cowan: Spesso in HEP, il livello di significatività in cui si dice che un effetto si qualifica come una scoperta èZ=5 , cioè un effetto , corrispondente a un valore p di . La reale convinzione che sia presente un nuovo processo, tuttavia, dipenderà in generale anche da altri fattori, come la plausibilità della nuova ipotesi di segnale e il grado in cui può descrivere i dati, la fiducia nel modello che ha portato al valore p osservato e possibili correzioni per più osservazioni da cui uno si concentra sul valore p più piccolo ottenuto (l '"effetto look altrove").5σ2.87×10−7
L'uso del livello è ora attribuito a 4 motivi:5σ
La storia basata sulla pratica ha scoperto che è una buona soglia. (cose esotiche sembrano accadere in modo casuale, anche tra e , come recentemente l' eccesso di difotoni da 750 GeV )5σ3 σ 4 σ3σ4σ
L' effetto look elsewhere (o i confronti multipli ). O perché vengono testate più ipotesi o perché gli esperimenti vengono eseguiti più volte, le persone si adattano a questo (molto approssimativamente) regolando il limite su . Questo si riferisce all'argomento della storia.5σ
Effetti sistematici e incertezza inσ spesso l'incertezza del risultato dell'esperimento non è ben nota. Il è derivato, ma la derivazione include ipotesi deboli come l'assenza di effetti sistematici o la possibilità di ignorarli. Aumentare la soglia sembra essere un modo per proteggere da questi eventi. (Questo è un po 'strano però. Il calcolato non ha alcuna relazione con la dimensione degli effetti sistematici e la logica si rompe, un esempio è la "scoperta" di neutrini superluminali che è stato segnalato avere un significato di .)σσ6 σ6σ
Affermazioni straordinarie richiedono prove straordinarie I risultati scientifici sono riportati in modo frequentista, ad esempio utilizzando intervalli di confidenza o valori p. Ma sono spesso interpretati in modo bayesiano. Illivelloè ritenuto responsabile di questo.5σ
Attualmente diverse critiche sono state scritte sulla soglia del da Louis Lyons , e anche i precedenti articoli di Robert D Cousins e Tommaso Dorigo forniscono una critica.5σ8 , 9 1 28,912
Altri campi
È interessante notare che molti altri settori scientifici non hanno soglie simili o, in qualche modo, non affrontano il problema. Immagino che ciò abbia un senso nel caso di esperimenti con umani in cui è molto costoso (o impossibile) estendere un esperimento che ha dato un significato di 0,05 o 0,01.
Il risultato della mancata considerazione di questi effetti è che oltre la metà dei risultati pubblicati potrebbe essere errata o almeno non riproducibile (questo è stato sostenuto per il caso della psicologia da Monya Baker , e credo che ci siano molti altri che hanno avanzato argomenti simili. Personalmente penso che la situazione potrebbe essere ancora peggiore nella scienza nutrizionale). E ora, persone di altri settori oltre alla fisica stanno pensando a come dovrebbero affrontare questo problema (il caso della medicina / farmacologia ).101111
Cousins, RD (2017). Paradosso Jeffreys-Lindley e criteri di scoperta nella fisica delle alte energie. Synthese, 194 (2), 395-432. collegamento arxiv
Dorigo, T. (2013) Demystifying The Five-Sigma Criterion, from science20.com 2019-03-07
Rosenfeld, AH (1968). Ci sono mesoni o barioni lontani? fonte web: borsa di studio
Burbidge, G., Roberts, M., Schneider, S., Sharp, N., & Tifft, W. (1990, novembre). Discussione del panel: problemi relativi a Redshift. In NASA Conference Publication (Vol. 3098, p. 462). collegamento alla fotocopia su harvard.edu
Franklin, A. (2013). Norme mutevoli: esperimenti di fisica delle particelle nel XX secolo. Università di Pittsburgh Press.
Cosa significa il 5 sigma? da physics.org 2019-03-07
Beringer, J., Arguin, JF, Barnett, RM, Copic, K., Dahl, O., Groom, DE, ... & Yao, WM (2012). Revisione della fisica delle particelle. Physical Review D-Particles, Fields, Gravitation and Cosmology, 86 (1), 010001. (sezione 36.2.2. Test di significatività, pagina 394, link aps.org )
Lyons, L. (2013). Alla scoperta del significato di 5 sigma. arXiv prestampa arXiv: 1310.1284. collegamento arxiv
Lyons, L. (2014). Problemi statistici nelle ricerche di nuova fisica. arXiv prestampa link arxiv
Baker, M. (2015). Oltre la metà degli studi psicologici non supera il test di riproducibilità. Notizie sulla natura. da nature.com 2019-03-07
Horton, R. (2015). Offline: qual è il 5 sigma della medicina ?. The Lancet, 385 (9976), 1380. da thelancet.com 2019-03-07