TL; DR: A meno che tu non presuma che le persone siano irragionevolmente cattive nel giudicare il colore delle auto o che le auto blu siano irragionevolmente rare, il gran numero di persone nel tuo esempio indica che la probabilità che l'auto sia blu è sostanzialmente al 100%.
Matthew Drury ha già dato la risposta giusta, ma vorrei solo aggiungerla con alcuni esempi numerici, perché hai scelto i tuoi numeri in modo tale da ottenere risposte abbastanza simili per una vasta gamma di impostazioni di parametri diverse. Ad esempio, supponiamo, come hai detto in uno dei tuoi commenti, che la probabilità che le persone giudichino correttamente il colore di un'auto è 0,9. Cioè:
e anche
p ( dire che non è blu | macchina non è blu ) = 0.9 = 1 - p ( dire che è blu | l' auto non è blu )
p ( dire che è blu | l' auto è blu ) = 0.9 = 1 - p ( dire che non è blu | l' auto è blu )
p ( dire che non è blu | l' auto non è blu ) = 0.9 = 1 - p ( dire che è blu | l' auto non è blu )
Detto questo, la cosa rimanente che dobbiamo decidere è: qual è la probabilità precedente che l'auto sia blu? Scegliamo una probabilità molto bassa solo per vedere cosa succede e diciamo che , cioè solo lo 0,1% di tutte le auto è blu. Quindi la probabilità posteriore che l'auto sia blu può essere calcolata come:p (la macchina è blu ) = 0,001
p (la macchina è blu | risposte )= p ( risposte | l' auto è blu )p (l' auto è blu )p ( risponde | l' auto è blu )p (la macchina è blu ) + p ( risposte | la macchina non è blu )p (l' auto non è blu )= 0.9900× 0,1100× 0,0010.9900× 0,1100× 0,001 + 0,1900× 0.9100× 0.999
Se si guarda al denominatore, è abbastanza chiaro che il secondo termine in quella somma sarà trascurabile, poiché la dimensione relativa dei termini nella somma è dominata dal rapporto tra a , che è nell'ordine di . E infatti, se si esegue questo calcolo su un computer (avendo cura di evitare problemi numerici di underflow) si ottiene una risposta pari a 1 (con precisione della macchina). 0,1 900 10 580.99000.19001058
Il motivo per cui le probabilità precedenti non hanno molta importanza qui è perché hai così tante prove per una possibilità (l'auto è blu) rispetto ad un'altra. Questo può essere quantificato dal rapporto di probabilità , che possiamo calcolare come:
p ( risponde | l' auto è blu )p ( risposte | l' auto non è blu )= 0.9900× 0,11000.1900× 0.9100≈ 10763
Quindi, prima ancora di considerare le probabilità precedenti, l'evidenza suggerisce che un'opzione è già astronomicamente più probabile dell'altra, e affinché il precedente faccia la differenza, le auto blu dovrebbero essere irragionevolmente, stupidamente rare (così rare che ci aspetteremmo trova 0 auto blu sulla terra).
E se cambiassimo quanto sono precise le persone nelle loro descrizioni del colore delle auto? Ovviamente, potremmo spingerlo all'estremo e dire che riescono a farlo bene solo il 50% delle volte, il che non è meglio che lanciare una moneta. In questo caso, la probabilità posteriore che l'auto sia blu è semplicemente uguale alla probabilità precedente, perché le risposte della gente non ci hanno detto nulla. Ma sicuramente le persone fanno almeno un po 'meglio di così, e anche se diciamo che le persone sono accurate solo il 51% delle volte, il rapporto di probabilità funziona ancora in modo che sia circa volte più probabile per l'auto essere blu.1013
Tutto questo è il risultato dei numeri piuttosto grandi che hai scelto nel tuo esempio. Se fossero state 9/10 persone a dire che l'auto era blu, sarebbe stata una storia molto diversa, anche se lo stesso rapporto di persone si trovava in un campo rispetto all'altro. Perché l'evidenza statistica non dipende da questo rapporto, ma piuttosto dalla differenza numerica tra le fazioni opposte. In effetti, nel rapporto di verosimiglianza (che quantifica le prove), le 100 persone che dicono che l'auto non è blu annullano esattamente 100 delle 900 persone che dicono che è blu, quindi è lo stesso che se avessi 800 persone tutte d'accordo era blu. E questa è ovviamente una prova abbastanza chiara.
(Modifica: come ha sottolineato Silverfish , le ipotesi che ho fatto qui implicano che ogni volta che una persona descrive erroneamente un'auto non blu, per impostazione predefinita si dice che è blu. Questo non è realistico ovviamente, perché potrebbero davvero dire qualsiasi colore , e dirà blu solo un po 'di tempo. Questo non fa alcuna differenza per le conclusioni, dal momento che meno persone sono suscettibili di scambiare un'auto non blu con una blu, più forte è la prova che è blu quando lo dicono Quindi, se non altro, i numeri indicati sopra sono in realtà solo un limite inferiore alle prove a favore del blu.)