Le statistiche bayesiane riassumono le credenze mentre le statistiche frequentiste riassumono le prove. I bayesiani vedono la probabilità come un grado di credenza. Questo tipo di ragionamento inclusivo e generativo è utile per formulare ipotesi. Ad esempio, i bayesiani potrebbero essere in grado di assegnare arbitrariamente qualche probabilità all'idea che la luna sia fatta di formaggio verde, indipendentemente dal fatto che gli astronauti siano stati effettivamente in grado di viaggiare lì per verificarlo. Questa ipotesi è forse supportata dall'idea che, da lontano, la luna sembracome il formaggio verde. I frequentatori non possono singolarmente concepire un'ipotesi che sia più di un semplice pagliaccio, né possono dire che l'evidenza favorisca un'ipotesi rispetto a un'altra. Anche la massima probabilità genera solo una statistica che è "più coerente con ciò che è stato osservato". Formalmente, le statistiche bayesiane ci consentono di pensare fuori dagli schemi e di proporre idee difendibili dai dati. Ma questa è strettamente ipotesi che si genera in natura.
Le statistiche dei frequentisti sono meglio applicate per confermare le ipotesi. Quando un esperimento viene condotto bene, le statistiche del frequentista forniscono un contesto di "osservatore indipendente" o "empirico" ai risultati evitando i priori. Ciò è coerente con la filosofia scientifica di Karl Popper. Il punto di prova non è quello di diffondere una certa idea. Molte prove sono coerenti con ipotesi errate. Le prove possono semplicemente falsificare le credenze.
L'influenza dei priori è generalmente considerata un pregiudizio nel ragionamento statistico. Come sapete, possiamo inventare un gran numero di motivi per cui le cose accadono. Psicologicamente, molte persone credono che il nostro pregiudizio all'osservatore sia il risultato di priori nel nostro cervello che ci impediscono di ponderare veramente ciò che vediamo. "Osservazione delle nuvole di speranza", come ha detto la Reverenda Madre a Dune. Popper rese questa idea rigorosa.
Ciò ebbe una grande importanza storica in alcuni dei più grandi esperimenti scientifici del nostro tempo. Ad esempio, John Snow ha raccolto meticolosamente prove per l'epidemia di colera e ha concluso con astuzia che il colera non è causato dalla privazione morale e ha sottolineato che le prove erano altamente coerenti con la contaminazione delle acque reflue: nota che non ha conclusoquesto, i risultati di Snow hanno preceduto la scoperta di batteri e non vi è stata alcuna comprensione meccanicistica o eziologica. Un discorso simile si trova in Origine delle specie. In realtà non sapevamo se la luna fosse fatta di formaggio verde fino a quando gli astronauti non atterrarono in superficie e raccolsero campioni. A quel punto, i posteriori bayesiani hanno assegnato una probabilità molto, molto bassa a qualsiasi altra possibilità, e i frequentatori nella migliore delle ipotesi possono dire che i campioni sono altamente incompatibili con qualsiasi cosa tranne la polvere di luna.
In sintesi, le statistiche bayesiane sono suscettibili di generare ipotesi e le statistiche frequentiste sono suscettibili di conferma dell'ipotesi. Garantire che i dati vengano raccolti in modo indipendente in questi sforzi è una delle maggiori sfide che gli statistici moderni affrontano.