Se 900 persone su 1000 affermano che un'auto è blu, qual è la probabilità che sia blu?


114

Questo inizialmente è sorto in relazione al lavoro che stiamo facendo su un modello per classificare il testo naturale, ma l'ho semplificato ... Forse troppo.

Hai una macchina blu (per qualche misura scientifica oggettiva - è blu).

Lo mostri a 1000 persone.

900 dicono che è blu. 100 no.

Tu dai queste informazioni a qualcuno che non può vedere la macchina. Tutto quello che sanno è che 900 persone hanno detto che era blu e 100 no. Non sai più nulla di queste persone (le 1000).

Sulla base di questo, chiedi alla persona "Qual è la probabilità che l'auto sia blu?"

Ciò ha causato un'enorme divergenza di opinioni tra quelle che ho chiesto! Qual è la risposta giusta, se ce n'è una?


162
Mi chiedo quali sarebbero le risposte se cambiassi auto per vestire .
user1717828

13
Quindi qual è la domanda per le persone? "L'auto è blu?" o "Di che colore è la macchina?"
kon psych,

13
Cosa significa che l'auto è blu? Se alcune persone dicono che l'auto non è blu, è probabile che sia un colore che alcune persone chiamano blu e altre chiamano con un nome diverso. Questo non significa che non sono d'accordo sul colore, ma che non sono d'accordo sul nome del colore.
Ben

7
Penso che la domanda sarebbe molto migliorata se dessi le diverse opinioni divergenti che hai incontrato. Allo stato attuale, le risposte possono semplicemente esplorare l'intero campo, dalla teoria della probabilità alla teoria del colore o persino alla biologia (daltonismo) selvaggiamente, e non vedo come ciò possa davvero aiutarti.
AnoE

32
Manca qualcosa nella descrizione del problema. 100 persone negano che l'auto sia blu quando certamente è blu molte persone, non puoi semplicemente scartarle come errori casuali.
Aksakal,

Risposte:


117

TL; DR: A meno che tu non presuma che le persone siano irragionevolmente cattive nel giudicare il colore delle auto o che le auto blu siano irragionevolmente rare, il gran numero di persone nel tuo esempio indica che la probabilità che l'auto sia blu è sostanzialmente al 100%.

Matthew Drury ha già dato la risposta giusta, ma vorrei solo aggiungerla con alcuni esempi numerici, perché hai scelto i tuoi numeri in modo tale da ottenere risposte abbastanza simili per una vasta gamma di impostazioni di parametri diverse. Ad esempio, supponiamo, come hai detto in uno dei tuoi commenti, che la probabilità che le persone giudichino correttamente il colore di un'auto è 0,9. Cioè: e anche p ( dire che non è blu | macchina non è blu ) = 0.9 = 1 - p ( dire che è blu | l' auto non è blu )

p(say it's blue|car is blue)=0.9=1p(say it isn't blue|car is blue)
p(say it isn't blue|car isn't blue)=0.9=1p(say it is blue|car isn't blue)

Detto questo, la cosa rimanente che dobbiamo decidere è: qual è la probabilità precedente che l'auto sia blu? Scegliamo una probabilità molto bassa solo per vedere cosa succede e diciamo che , cioè solo lo 0,1% di tutte le auto è blu. Quindi la probabilità posteriore che l'auto sia blu può essere calcolata come:p(car is blue)=0.001

p(car is blue|answers)=p(answers|car is blue)p(car is blue)p(answers|car is blue)p(car is blue)+p(answers|car isn't blue)p(car isn't blue)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0.999

Se si guarda al denominatore, è abbastanza chiaro che il secondo termine in quella somma sarà trascurabile, poiché la dimensione relativa dei termini nella somma è dominata dal rapporto tra a , che è nell'ordine di . E infatti, se si esegue questo calcolo su un computer (avendo cura di evitare problemi numerici di underflow) si ottiene una risposta pari a 1 (con precisione della macchina). 0,1 900 10 580.99000.19001058

Il motivo per cui le probabilità precedenti non hanno molta importanza qui è perché hai così tante prove per una possibilità (l'auto è blu) rispetto ad un'altra. Questo può essere quantificato dal rapporto di probabilità , che possiamo calcolare come:

p(answers|car is blue)p(answers|car isn't blue)=0.9900×0.11000.1900×0.910010763

Quindi, prima ancora di considerare le probabilità precedenti, l'evidenza suggerisce che un'opzione è già astronomicamente più probabile dell'altra, e affinché il precedente faccia la differenza, le auto blu dovrebbero essere irragionevolmente, stupidamente rare (così rare che ci aspetteremmo trova 0 auto blu sulla terra).

E se cambiassimo quanto sono precise le persone nelle loro descrizioni del colore delle auto? Ovviamente, potremmo spingerlo all'estremo e dire che riescono a farlo bene solo il 50% delle volte, il che non è meglio che lanciare una moneta. In questo caso, la probabilità posteriore che l'auto sia blu è semplicemente uguale alla probabilità precedente, perché le risposte della gente non ci hanno detto nulla. Ma sicuramente le persone fanno almeno un po 'meglio di così, e anche se diciamo che le persone sono accurate solo il 51% delle volte, il rapporto di probabilità funziona ancora in modo che sia circa volte più probabile per l'auto essere blu.1013

Tutto questo è il risultato dei numeri piuttosto grandi che hai scelto nel tuo esempio. Se fossero state 9/10 persone a dire che l'auto era blu, sarebbe stata una storia molto diversa, anche se lo stesso rapporto di persone si trovava in un campo rispetto all'altro. Perché l'evidenza statistica non dipende da questo rapporto, ma piuttosto dalla differenza numerica tra le fazioni opposte. In effetti, nel rapporto di verosimiglianza (che quantifica le prove), le 100 persone che dicono che l'auto non è blu annullano esattamente 100 delle 900 persone che dicono che è blu, quindi è lo stesso che se avessi 800 persone tutte d'accordo era blu. E questa è ovviamente una prova abbastanza chiara.

(Modifica: come ha sottolineato Silverfish , le ipotesi che ho fatto qui implicano che ogni volta che una persona descrive erroneamente un'auto non blu, per impostazione predefinita si dice che è blu. Questo non è realistico ovviamente, perché potrebbero davvero dire qualsiasi colore , e dirà blu solo un po 'di tempo. Questo non fa alcuna differenza per le conclusioni, dal momento che meno persone sono suscettibili di scambiare un'auto non blu con una blu, più forte è la prova che è blu quando lo dicono Quindi, se non altro, i numeri indicati sopra sono in realtà solo un limite inferiore alle prove a favore del blu.)


11
+1. In effetti, dati i dati di OP, la stima MLE della frequenza con cui le persone sono accurate è 900/1000 = 90%.
ameba,

5
Ottenere il colore corretto di un'auto nel 50% dei casi non equivale a lanciare una moneta. Dopotutto, ci sono molti più di due soli colori disponibili. Inoltre, forse alcuni dicono "blu" o "azzurro" anziché "blu"? In realtà, la gente potrebbe dire erroneamente "blu" quando la risposta corretta sarebbe "un colore brevettato elegante e alla moda che sembra quasi blu"
Hagen von Eitzen

10
So che queste sono solo figure illustrative, ma se "la probabilità che le persone giudichino correttamente il colore di un'auto è 0,9", quindi, a meno che non ci sia qualcosa di speciale nel colore blu, non credo sia ragionevole rivendicare p (diciamo è blu | l'auto non è blu) = 0.1. Se pensiamo che il 90% delle volte, la gente identifichi il colore corretto, allora p (diciamo rosso | macchina è rossa) = p (diciamo bianco | macchina è bianca) = p (diciamo verde | macchina è verde) = 0.9 e così acceso per tutti i possibili colori dell'auto. Ma perché p (dire blu | macchina è rossa) = p (dire blu | macchina è bianca) = p (dire blu | macchina è verde) = 0.1? Ciò implicherebbe ad esempio p (diciamo che il bianco | la macchina è rossa) = 0.
Silverfish

2
@PatMolloy: non necessariamente. Dipende dal fatto che le probabilità siano simmetriche: è altrettanto probabile che qualcuno sbagli un blu per un'auto non blu, in quanto qualcuno sbaglia un non blu per un'auto blu? In tal caso, un verdetto 500/500 fornisce esattamente quante più informazioni di un lancio di una moneta. Ma se le persone hanno meno probabilità di dire che un'auto non blu è blu, allora devono dire che un'auto blu non è blu, quindi i 500 blue-sayers sono più difficili da spiegare rispetto ai 500 non blue-sayers, sotto il ipotesi non blu. Quindi, in tal caso, l'equilibrio delle prove si inclinerebbe verso il blu.
Ruben van Bergen,

3
La percezione del colore è una cosa difficile ... se nove persone su dieci dicono che un vestito è bianco e oro, qual è la probabilità che sia blu e nero?
Glen_b,

73

La risposta corretta dipende dalle informazioni non specificate nel problema, dovrai fare alcune ipotesi per ricavare una risposta unica e definitiva:

  • La probabilità precedente che l'auto sia blu, vale a dire la tua convinzione che l'auto sia blu dato che non hai ancora chiesto a nessuno.
  • La probabilità che qualcuno ti dica che l'auto è blu quando in realtà è blu e la probabilità che ti dicono che l'auto è blu quando in realtà non è blu.
  • La probabilità che l'auto sia effettivamente blu quando qualcuno lo dice, e la probabilità che l'auto non sia blu, quando qualcuno dice che è blu.

Con queste informazioni, possiamo scomporre tutto con la formula di Bayes per ricavare una probabilità posteriore che l'auto sia blu. Mi concentrerò sul caso in cui chiediamo solo una persona, ma lo stesso ragionamento può essere applicato al caso in cui chiedi a persone.1000

Ppost(car is blue)=P(car is bluesay is blue)P(say is blue)    +P(car is bluesay is not blue)P(say is not blue)

Dobbiamo continuare a scomporre ulteriormente , qui entra in gioco il precedente:P(say is blue)

P(say is blue)= P(say is bluecar is blue)Pprior(car is blue)+P(say is bluecar is not blue)Pprior(car is not blue)

Quindi due applicazioni della regola di Bayes ti portano lì. Dovrai determinare i parametri non specificati in base alle informazioni che hai sulla situazione specifica o facendo ipotesi ragionevoli.

Esistono alcune altre combinazioni di quali ipotesi è possibile fare, in base a:

P(say is bluecar is blue)P(car is blue)=P(car is bluesay is blue)P(say is blue)

All'inizio, non conosci nessuna di queste cose. Quindi è necessario formulare alcune ipotesi ragionevoli su tre di esse, e quindi la quarta viene determinata da lì.


5
Questo è spesso il caso. Quindi hai due opzioni, esprimi la tua totale mancanza di conoscenza assumendo che il blu e non il blu siano ugualmente probabili. Fai un rapido sondaggio sul campo, qualcosa del genere può aiutarti: en.wikipedia.org/wiki/Car_colour_popularity
Matthew Drury

18
@Matthew il problema con "blu e non blu è altrettanto probabile" è che non è coerente; se applichiamo lo stesso ragionamento a ciascuno dei possibili colori della macchina, finiamo con l'affermare che tutti hanno contemporaneamente il 50% di possibilità (impossibile con più di due colori dalle leggi della probabilità) e meno del 50% di probabilità (quando guarda il blu tra "non bianco" e "non rosso", il che porta anche a contraddizioni poiché la probabilità di qualsiasi colore non può assumere più valori)
Glen_b

2
Ci sono informazioni più non specificate di questa perché la risposta della gente non deve essere indipendente (in effetti, speriamo che siano fortemente correlate al colore oggettivo, quindi tutt'altro che indipendente). Cosa succede se le risposte dipendono "eccessivamente"? Diciamo, chiediamo semplicemente a dieci pedoni casuali, ma ognuno di loro ha risposto 100 volte?
Hagen von Eitzen,

2
@HagenvonEitzen e MatthewDrury. In realtà, anche ciò che devi assumere non è l'indipendenza ma l' indipendenza condizionale . In altre parole . P(Joe and Mary say blue|car is blue)=P(Joe says blue|car is blue)P(Mary says blue|car is blue)
Luca Citi,

15
@Glen_b: ci sono solo due colori al mondo, blu e non blu. Certo, entrambi sono disponibili in una varietà di sfumature, in particolare non blu.
psmears,

13

C'è un presupposto importante che le tue 1000 opinioni non condividano un orientamento sistematico. Il che è un presupposto ragionevole qui, ma potrebbe essere importante in altri casi.

Esempi potrebbero essere:

  • condividono tutti una cecità simile (ad esempio la genetica in una popolazione),
  • vedevano tutti la macchina di notte sotto l'illuminazione stradale arancione al sodio,
  • condividono tutti una cultura comune in cui il blu è tabù o magicamente associato (che predispone se descrivono o meno qualsiasi oggetto come blu o usano un eufemismo culturale o qualsiasi altra cosa),
  • a tutti è stato detto (o condividono una convinzione comune) che se fanno / non rispondono in un modo specifico, accadrà loro qualcosa di buono / cattivo .....

Non è probabile in questo caso, ma è un presupposto implicito significativo in altri casi. Non deve essere neanche così estremo - trasponi la tua domanda ad un altro dominio e questo sarà un vero fattore.

Esempi per ciascuno in cui la tua risposta potrebbe essere influenzata da una distorsione condivisa:

  • chiedi se un bicchiere alto e sottile contiene più di un bicchiere grasso grasso effettivamente identico, ma i tuoi 1000 intervistati sono bambini molto piccoli (percezione errata condivisa).
  • chiedi a 1000 persone se camminare sotto una scala è pericoloso (convinzione culturale comune)
  • chiedi a 1000 persone sposate se amano il loro partner / hanno avuto una relazione, in circostanze in cui credono che il loro partner saprà della loro risposta. Il contesto potrebbe essere un programma TV o un partner presente quando richiesto, ecc. (Convinzione comune sulle conseguenze)

Non sarebbe difficile immaginare alcune domande strutturalmente identiche in cui la risposta 900: 100 era una misura di credenze e onestà, o qualcos'altro, e non punta alla risposta corretta. Probabilmente in questo caso ma in altri casi - sì.


11

Uno dei motivi per cui ricevi risposte diverse da persone diverse è che la domanda può essere interpretata in modi diversi, e non è chiaro cosa intendi per "probabilità" qui. Un modo per dare un senso alla domanda è assegnare i priori e la ragione usando la regola di Bayes come nella risposta di Matteo.

Prima di chiedere le probabilità, devi decidere cosa è modellato come casuale e cosa no. Non è universalmente accettato che a priori vengano assegnate quantità sconosciute ma fisse. Ecco un esperimento simile al tuo che evidenzia il problema con la domanda:

Supponiamo che , siano le variabili casuali di Bernoulli con probabilità di successo (media) . Per interpretabilità, pensiamo come di monete. Supponiamo di osservare (la statistica sufficiente) . Qual è la probabilità che la moneta sia giusta? i = 1 , , 1000 p = 0,5 X i 1000 i = 1 X i = 900Xii=1,,1000p=0.5Xii=11000Xi=900

Da una prospettiva frequentista la domanda è o senza senso o la risposta è "una". Se sei bayesiano, potresti voler assegnare una distribuzione precedente a , nel qual caso la domanda ha senso. La differenza fondamentale tra il mio esempio e la domanda è che è sconosciuta nella domanda, e la domanda nasconde il fatto che la casualità effettiva è se una persona (presumibilmente campionata casualmente) risponde che l'auto è blu o no. Il colore dell'auto non è assegnato in modo casuale e quindi non è interessante parlare della probabilità che sia blu da una prospettiva frequentista.ppp


1
Quindi, se rimuovi il presupposto che l'auto è blu e il resto è lo stesso, 900 persone dicono che è blu e 100 dicono di no, in quel caso la probabilità sarebbe 0,9?
utente

No, è molto più vicino a 1. È molto, molto improbabile che 900 persone su 1000 abbiano sbagliato colore.
gnasher729,

1
the probability is either one or zero, depending on whether the car is actually blue or not.ciò non corrisponde a una comprensione della "probabilità" come la conosco. Sembra un po 'come "X può accadere o non può accadere, quindi la probabilità deve essere del 50%". Puoi rendere un po 'più chiaro cosa intendi con quella frase?
AnoE

2
@AnoE la distinzione è analoga a quella tra parametri e variabili casuali. È dato nel contesto della domanda che l'auto è per un certo blu, il suo colore non è il risultato di un esperimento casuale. È essenzialmente un'interpretazione frequentista v. Bayesiana. Se lanci una moneta 1000 volte e osservi 900 teste, qual è la probabilità che la moneta sia giusta? È uno o zero se sei un frequentatore (o senza senso); non assegniamo probabilità ai parametri.
ekvall,

@utente No, ho aggiornato la risposta per chiarire il mio punto.
ekvall,

7

Risposta pratica semplice:

La probabilità può facilmente variare dallo 0% al 100% a seconda delle ipotesi

Anche se mi piacciono molto le risposte esistenti, in pratica si riduce sostanzialmente a questi due semplici scenari:

Scenario 1: si presume che le persone siano molto brave a riconoscere il blu quando è blu ... 0%

In questo caso, ci sono così tante persone che affermano che l'auto non è blu, che è molto improbabile che l'auto sia effettivamente blu. Quindi, la probabilità si avvicina allo 0%.

Scenario 2: si presume che le persone siano molto brave a riconoscere il non blu quando non è blu ... 100%

In questo caso, ci sono così tante persone che affermano che l'auto è blu, che è molto probabile che sia davvero blu. Quindi la probabilità si avvicina al 100%.


Naturalmente arrivando a questo punto da un punto di vista matematico, inizieresti con qualcosa di generico come "supponiamo che le probabilità rilevanti siano ...", il che è abbastanza insignificante in quanto tali cose non sono in genere note per alcuna circostanza casuale. Quindi sostengo guardando gli estremi per afferrare l'idea che entrambe le percentuali possono essere facilmente giustificate con ipotesi semplici e realistiche e che quindi non esiste una risposta unica e significativa.


2
Se "si presume che le persone siano molto brave a riconoscere il blu", perché stimerebbero che è blu quando non è nello scenario 1? Potresti voler esprimere i tuoi scenari in termini di falsi positivi e falsi negativi.
hyde,

@hyde Rielaborato gli scenari per rimuovere l'ambiguità
Dennis Jaheruddin


5

È necessario sviluppare un quadro di stima. Alcune domande che potresti porre sono

  1. Quanti colori ci sono? Stiamo parlando di due colori? O tutti i colori dell'arcobaleno?

  2. Quanto sono distinti i colori? Stiamo parlando di blu e arancione? O blu, ciano e turchese?

  3. Cosa significa essere blu? Sono ciano e / o blu turchese? O solo il blu stesso?

  4. Quanto sono brave queste persone a stimare il colore? Sono tutti grafici? O sono daltonici?

Da un punto di vista puramente statistico, possiamo fare alcune ipotesi sull'ultimo. Innanzitutto, sappiamo che almeno il 10% delle persone sceglie una risposta errata. Se ci sono solo due colori (dalla prima domanda), allora potremmo dire che c'è

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

Come controllo rapido, se sommiamo quelli insieme, otteniamo il 100%. Puoi vedere una notazione più matematica di questo nella risposta @MatthewDrury .

Come otteniamo il 90% nel terzo? È quante persone hanno detto blu ma si sbagliavano se non lo fosse. Perché ci sono solo due colori, questi sono simmetrici. Se ci fossero più di due colori, allora la possibilità che la scelta sbagliata fosse blu quando dicevano qualcos'altro sarebbe inferiore.

Comunque, questo metodo di stima ci fornisce il 90% di blu. Ciò include una probabilità dell'81% di persone che dicono blu quando è e una probabilità del 9% di persone che dicono che non lo è quando è. Questo è probabilmente il più vicino a cui possiamo arrivare a rispondere alla domanda originale e ci richiede di fare affidamento sui dati per stimare due cose diverse. E supporre che la possibilità di scegliere il blu sia la stessa possibilità che il blu sia corretto.

Se ci sono più di due colori, la logica cambierà un po '. Le prime due righe rimangono invariate, ma perdiamo la simmetria nelle ultime due righe. In tal caso, abbiamo bisogno di più input. Probabilmente possiamo stimare la possibilità di ripetere correttamente il blu come 81%, ma non abbiamo idea di quali siano le probabilità che il colore sia blu quando qualcuno dice che non lo è.

Potremmo anche migliorare anche la stima dei due colori. Dato un numero statisticamente significativo di automobili di ogni colore, potremmo avere un numero statisticamente significativo di persone che le visualizzano e le classificano. Quindi potremmo contare quanto spesso le persone hanno ragione quando fanno ogni scelta di colore e quanto spesso sono giuste per ogni scelta di colore. Quindi potremmo stimare in modo più accurato le scelte effettive delle persone.

Potresti chiedere come il 90% potrebbe essere sbagliato. Considera cosa succede se ci sono tre colori: azzurro, blu e zaffiro. Qualcuno potrebbe ragionevolmente considerare tutti e tre questi come blu. Ma vogliamo di più. Vogliamo la tonalità esatta. Ma chi ricorda i nomi delle altre tonalità? Molti potrebbero indovinare il blu perché è l'unica tonalità corrispondente che conoscono. E ancora sbagli quando risulta essere azzurro.


Come menzionato in uno dei commenti precedenti, sicuramente gli unici due colori rilevanti sono "blu" e "non blu", quindi la parte relativa a più colori non dovrebbe essere necessaria.
Dennis Jaheruddin,

4

Una probabilità esatta, matematica, vera / falsa non può essere calcolata con le informazioni fornite.

Tuttavia, nella vita reale tali informazioni non sono mai disponibili con certezza. Pertanto, usando la nostra intuizione (e dove andrebbero tutti i miei soldi se scommettessimo), l'auto è decisamente blu. (alcuni credono che non si tratti più di statistiche, ma beh, le visualizzazioni in bianco e nero della scienza non sono molto utili)

Il ragionamento è semplice. Supponiamo che l'auto non sia blu. Quindi il 90% delle persone (!) Aveva torto. Potrebbero essere sbagliati solo a causa di un elenco di problemi tra cui:

  • daltonismo
  • menzogne ​​patologiche
  • essere sotto l'influenza di sostanze come alcol, LCD, ecc
  • non capire la domanda
  • altra forma di disturbo mentale
  • una combinazione di quanto sopra

Dal momento che quanto sopra non è chiaramente in grado di influenzare il 90% di una popolazione casuale media (ad es. Daltonismo colpisce circa l'8% dei maschi e lo 0,6% delle femmine, ovvero 43 persone su 1000), è necessariamente il caso che l'auto sia blu. (Cioè se tutti i miei soldi andassero comunque).


Questo mi sembra intuitivamente giusto. Penso che la critica alla domanda originale sia che non fornisce abbastanza informazioni e che devono essere fatte alcune ipotesi .. beh, non è quasi sempre così nel mondo reale ???
Pat Molloy,

@PatMolloy Non fornisce abbastanza informazioni per fornire una risposta matematica sofisticata esatta giusta / sbagliata (che è certamente ciò che molte domande mirano a ottenere da questo sito). Tuttavia, date le informazioni ridotte che hai fornito, quando si tratta di scommettere denaro, questa è la risposta (100%) che la gente sceglierà.
Luchonacho,

1
Penso che tu non sia riuscito a coprire alcune delle alternative più plausibili - che sono quelle che dovrebbero farti modificare le tue conclusioni. Questi includono (a) le persone non sono in grado di riconoscere il blu; (b) non esiste una comprensione comune del "blu" tra l'interrogante e gli intervistati; (c) il significato "scientifico" di "blu" differisce da ciò che le persone comunemente intendono come "blu". È importante sottolineare che, poiché non è possibile quantificare nessuna di queste alternative, né la maggior parte di quelle elencate, come è possibile giustificare la quantificazione della probabilità della risposta? Non sono statistiche!
whuber

"Dal momento che quanto sopra non è chiaramente in grado di influenzare il 90% di una popolazione casuale media" Non essere così sicuro. Ricorda che generalmente parliamo di medie quando discutiamo di umani. Quindi, solo un po 'per cento ha il daltonismo (rispetto alla media), ma ci possono essere alcuni distinti che hanno una visione superiore, ad esempio i tetracromatici.
NPSF3000,

2
Sono sempre sotto l'influenza di LCD
Alex

2

Non mangerei le feci in base al fatto che miliardi di mosche non possono essere sbagliate. Potrebbero esserci dozzine di altri motivi per cui 900 persone su 1000 potrebbero essere state ingannate per pensare che l'auto fosse blu. Dopotutto, questa è la base di trucchi magici, che inducono le persone a pensare a qualcosa di rimosso dalla realtà. Se 900 persone su 1000 vedono un mago che accoltella il suo assistente, risponderanno prontamente all'assistente che è stato pugnalato, per quanto sia improbabile un omicidio sul palco. Una luce blu su una vernice riflettente per auto, qualcuno?


2

La questione sa troppo poco su come è stato effettuato il sondaggio per rispondere alla domanda in modo accurato. Per quanto lo riguarda, il sondaggio può soffrire di diversi problemi:

Le persone che hanno partecipato al sondaggio avrebbero potuto essere di parte:

  1. L'auto sembrava blu a causa di un'illusione ottica .

  2. Il colore della macchina era per qualche motivo difficile da osservare, e per qualche ragione alla gente erano state mostrate molte macchine blu prima di questa, facendo credere a molte di loro che anche questa fosse probabilmente blu.

  3. Li hai pagati per dire che l'auto è blu.

  4. Qualcuno li ha ipnotizzati nel credere che la macchina sia blu.

  5. Avevano stretto un patto per mentire e sabotare il sondaggio.

Potrebbero esserci state correlazioni tra le persone che hanno partecipato al sondaggio a causa di come sono state selezionate o perché si sono influenzate a vicenda:

  1. Hai effettuato accidentalmente il sondaggio in una riunione di massa per persone con lo stesso tipo di daltonismo.

  2. Hai effettuato il sondaggio nelle scuole materne; le ragazze non erano interessate all'auto e la maggior parte dei ragazzi aveva il blu come colore preferito, facendoli immaginare che l'auto fosse blu.

  3. La prima persona a cui fu mostrata l'auto era ubriaca e pensò che fosse blu, gridò "È BLU", influenzando tutti gli altri a pensare che l'auto fosse blu.

Quindi, mentre la probabilità che l'auto sia blu se il sondaggio è stato eseguito correttamente è estremamente elevata (come spiegato nella risposta di Ruben van Bergen), l'affidabilità del sondaggio potrebbe essere stata compromessa, il che rende probabile che l'auto non sia blu insignificante. Quanto è grande la questione che stima che questa possibilità alla fine dipenda dalle sue stime di quanto sia probabile che le circostanze si siano rovinate al sondaggio e di quanto sei bravo a svolgere sondaggi (e quanto malizioso pensi di essere).


2

Qual è la definizione di "blue"?

Culture e lingue diverse hanno nozioni diverse di blu. IIRC, alcune culture includono il verde nella loro nozione di blu!

Come ogni parola in linguaggio naturale, puoi solo supporre che ci sia una convenzione culturale su quando (e quando no) chiamare le cose "blu".

Nel complesso, il colore nella lingua è sorprendentemente soggettivo (link dai commenti qui sotto, grazie a @Count Ibilis)

inserisci qui la descrizione dell'immagine


7
Nel contesto della domanda, credo che questo particolare aspetto sia piuttosto irrilevante - suppongo che l'OP abbia scelto la parola "blu" come un termine molto generico e non qualcosa come "azzurro", "torqouise" ecc. Dove le persone potrebbero non essere sicure. Inoltre, le auto di solito tendono ad usare una tavolozza molto limitata di possibili / soliti colori. Alla fine, la domanda non è "perché 100 persone hanno detto non blu", ma "quale probabilità che l'auto sia effettivamente blu".
AnoE


Una definizione precisa sarebbe "irradia luce prevalentemente avente una lunghezza d'onda di 475 nm più minus ~ 10-20 nm nelle attuali condizioni ambientali". Questo è generalmente accettato come blu.
rackandboneman,

Sì, ma quante persone portano uno strumento per misurare la lunghezza d'onda predominante? Hai anche dimenticato di escludere lunghezze d'onda non visibili.
Anony-Mousse,

1
La domanda sembra riguardare l'uso statistico di un gruppo di persone di calibrazione sconosciuta come misuratore di lunghezza d'onda :)
rackandboneman,

1

La probabilità, a seconda di precondizioni più raffinate, potrebbe essere diversi valori diversi, ma il 99,995% è quello che ha più senso per me.

Sappiamo, per definizione, che l'auto è blu (che è al 100%), ma non è ben specificato cosa significhi in realtà (sarebbe un po 'filosofico). Presumo che qualcosa sia blu, nel senso che può essere davvero visto come blu.

Sappiamo anche che il 90% dei soggetti del test lo ha segnalato come blu.

Noi non sappiamo che cosa è stato chiesto o come la valutazione è stato fatto, e ciò che l'illuminazione condizioni la macchina era in. Essere chiesto di nominare il colore, alcuni soggetti potrebbero ad esempio, hanno detto "verde-blu" a causa di condizioni di illuminazione, e l'assessore potremmo non l'ho considerato "blu". Le stesse persone avrebbero potuto rispondere "sì" se la domanda fosse stata "È blu?". Presumo che tu non abbia intenzione di ingannare maliziosamente i tuoi soggetti di prova.

Sappiamo che l'incidenza di tritanopy è di circa lo 0,005%, il che significa che se l'auto potrebbe effettivamente essere vista come blu , allora il 99,995% dei soggetti del test vedrebbe davvero il colore come blu. Ciò, tuttavia, significa che il 9.995% dei soggetti del test non ha segnalato il blu quando ha visto chiaramente il blu. Stavano mentendo su ciò che hanno visto. Questo è vicino a ciò che la tua esperienza di vita ti dice anche: le persone non sono sempre oneste (ma, a meno che non ci sia un motivo, di solito lo sono).

Pertanto, la persona che non osserva può assumere con schiacciante certezza che l'auto è blu. Sarebbe al 100%

Tranne ... tranne se la persona non osservante stessa soffre di tritanopy, nel qual caso non vedrebbe la macchina come blu anche se tutti gli altri (o meglio, il 90% di loro) lo dicono. Qui diventa di nuovo filosofico: se tutti gli altri hanno sentito cadere un albero, ma io no, è caduto?

Oserei dire che la risposta più ragionevole e pratica sarebbe: se la persona che non osserva osserva di essere trianope (probabilità dello 0,005%), verificare se il colore previsto e il colore reale visti sono gli stessi produrrebbe falso. Pertanto, la probabilità è del 99,995% anziché del 100%.

Inoltre, come bonus, dato che abbiamo scoperto che il 9,995% dei soggetti testati sono bugiardi, ed è noto che tutti i cretesi sono bugiardi , possiamo concludere che non siamo a Creta!


1

Hai una macchina blu (per qualche misura scientifica oggettiva - è blu).

...

"Qual è la probabilità che l'auto sia blu?"

È blu al 100%.

Tutto quello che sanno è che 900 persone hanno detto che era blu e 100 no. Non sai più nulla di queste persone (le 1000).

L'uso di questi numeri (senza alcun contesto) è assolutamente privo di senso. Tutto si riduce all'interpretazione personale della domanda. Non dovremmo percorrere questa strada e usare Wittgenstein: "Wovon man nicht sprechen kann, darüber muss man schweigen".


Immagina la seguente domanda per il confronto:

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

Questo è fondamentalmente lo stesso problema (meno informazioni), ma è molto più chiaro che ciò che pensiamo del colore dell'auto è per lo più (se non del tutto) circostanziale.


A lungo termine, quando riceviamo più domande associate, siamo in grado di iniziare a indovinare le risposte a tali domande incomplete. Questo è lo stesso per l'algoritmo tit-for-tat che non funziona per un singolo caso, ma funziona a lungo termine . Nello stesso senso, Wittgenstein è tornato dal suo precedente lavoro con le sue Principal Investigations . Siamo in grado di rispondere a queste domande, ma abbiamo bisogno di maggiori informazioni / prove / domande. È un processo.


0

Se supponiamo che l'auto sia blu, allora 100 su 1.000 affermano che non è blu implica un bias di campionamento estremo di qualche tipo. Forse stavi campionando solo persone daltoniche. Se supponiamo che la macchina non sia blu, il bias del campione è ancora peggio. Quindi tutto ciò che possiamo concludere dai dati forniti è che il campione è molto distorto e dato che non sappiamo come sia stato distorto, non possiamo concludere nulla sul colore dell'auto.


Umm, sicuramente il fatto che 900 persone abbiano detto che era blu fa bene a qualcosa? Non possiamo concludere che è più probabile che sia blu che no ?? Ricorda che l'intervistato conosce solo i numeri 900 e 100. Quindi possono davvero dire qualcosa sul pregiudizio?
Pat Molloy,

0

Ci sono state alcune risposte. Non sono affatto un guru della matematica, ma bene, ecco il mio.

Ci possono essere solo 4 possibilità:

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

Dalla domanda, sai che la somma del caso 1 e del caso 4 è di 900 persone (90%) e la somma del caso 2 e del caso 3 è di 100 persone (10%). Tuttavia, ecco il trucco: ciò che non sai è la distribuzione all'interno di queste 2 coppie di casi. Forse la somma dei casi 1 e 4 è completamente composta dal caso 1 (che significa che l'auto è blu), o forse l'intera somma è composta dal caso 4 (che significa che l'auto non è blu). Lo stesso vale per la somma del caso 2 + 3. Quindi ... Ciò di cui hai bisogno è trovare un modo per prevedere la distribuzione all'interno delle somme dei casi. Senza altra indicazione nella domanda (da nessuna parte si dice che le persone sono sicure all'80% di conoscere i loro colori o qualcosa del genere) non c'è modo di trovare una risposta certa e definita.

Detto questo ... sospetto che la risposta attesa sia qualcosa del tipo:

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

dove il restante 50% è semplicemente sconosciuto, chiamalo margine di errore.


0

X,Y1,Y2,,Y1000{0,1}1p(x)pxYi|X=1p1Yi|X=0p0θ=(px,p0,p1)

p(θ,x|y1:1000)p(θ)p(x|θ)i=11000p(yi|x)

{xi}{yi|x}


-3

La persona che non può vedere l'auto non sa che è scientificamente provato che è blu. La probabilità che lui / lei sia blu è 50/50 (è blu o non lo è). Il polling di altre persone può influenzare l'opinione di questa persona, ma non cambia la probabilità che un'auto invisibile sia blu o meno.

Tutti i calcoli sopra descritti determinano la probabilità che il tuo set di campioni possa determinare se è blu.


Non sono sicuro che sia vero che la probabilità che sia blu è 50/50. In realtà, è molto meno di 50, dal momento che potrebbe essere rosso, bianco, giallo, ecc. La probabilità che un'auto scelta a caso sia blu è molto meno del 50%.
utente
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.