Per massimizzare la possibilità di indovinare correttamente il risultato di un lancio della moneta, dovrei sempre scegliere il risultato più probabile?


20

Questo non è un compito. Sono interessato a capire se la mia logica è corretta con questo semplice problema di statistiche.

Diciamo che ho una moneta a 2 facce in cui la probabilità di lanciare una testa è e la probabilità di lanciare una coda è . Supponiamo che tutti i lanci abbiano probabilità indipendenti. Ora, diciamo che voglio massimizzare le mie possibilità di prevedere se la moneta sarà una testa o una coda al prossimo lancio. Se , posso indovinare casualmente testa o croce e la probabilità che io sia corretta è .1 - P ( H ) P ( H ) = 0,5 0,5P(H)1P(H)P(H)=0.50.5

Supponiamo ora che , se voglio massimizzare le mie possibilità di indovinare correttamente, dovrei sempre indovinare le code in cui la probabilità è ?0,8P(H)=0.20.8

Facendo un ulteriore passo avanti, se avessi un dado a 3 facce e la probabilità di tirare un 1, 2 o 3 era , e , dovrei sempre indovinare 2 per massimizzare le mie possibilità di indovinare correttamente? Esiste un altro approccio che mi consentirebbe di indovinare con maggiore precisione?P ( 2 ) = 0.5 P ( 3 ) = 0.4P(1)=0.1P(2)=0.5P(3)=0.4


4
Mi sembra che tu stia chiedendo l'indipendenza: ad esempio, se ottieni una volta la testa, la prossima volta le "code" saranno più probabili? Se questo non è quello che stai chiedendo, potresti chiarire la tua domanda? (Se ho capito correttamente la tua domanda, la risposta è 'sì': in situazioni come il lancio della moneta il risultato più probabile sarà sempre il risultato con la massima probabilità, indipendentemente da ciò che è accaduto in precedenza.)
arboviral

Grazie per l'aiuto @arboviral. Sì, sto assumendo l'indipendenza. Ho aggiornato la domanda per indicare questo.
tartaruga

4
Supponendo che l'indipendenza sia la cosa migliore che puoi fare è scegliere il lato con la più alta probabilità. Pensare in questo modo. Non hai altre informazioni per indovinare meglio. Tutto quello che sai sui dadi è la frequenza con cui un certo lato si presenta e quali sono stati gli ultimi lanci della coppia. Ma l'indipendenza ti dice che le file precedenti non hanno alcun effetto sul tiro corrente. Forse se avessi avuto più informazioni come la quantità di forza usata per lanciare i dadi, il lanciatore della mano sinistra / destra o il numero di colpi prima del lancio. Tuttavia, se il dado è veramente giusto, dubito che anche quel livello di dettaglio fornirebbe previsioni migliori.
Brent Ferrier,

La tua ipotesi è corretta; è una conseguenza immediata della disuguaglianza del titolare (con i parametri ). (1,)
whuber

Sai che P (H) = 0,2? O è qualcosa che devi capire osservando i risultati?
Akavall,

Risposte:


43

Hai ragione. Se , e stai usando una perdita pari a zero (cioè, devi indovinare un risultato effettivo rispetto a una probabilità o qualcosa del genere, e inoltre, ottenere teste quando hai indovinato le code è ugualmente cattivo come ottenere code quando hai indovinato le teste), dovresti indovinare le code ogni volta.P(H)=0.2

Le persone spesso pensano erroneamente che la risposta sia indovinare la coda su un 80% di prove casualmente selezionato e andare avanti per il resto. Questa strategia è chiamata " accoppiamento della probabilità " ed è stata ampiamente studiata nel processo decisionale comportamentale. Vedi, ad esempio,

West, RF, & Stanovich, KE (2003). La corrispondenza delle probabilità è intelligente? Associazioni tra scelte probabilistiche e capacità cognitive. Memory & Cognition, 31 , 243–251. doi: 10,3758 / BF03194383


1
+1 per il puntatore alla corrispondenza della probabilità. Non ne ho mai sentito parlare prima, anche se sono sicuro di approfittarne ogni giorno come un pregiudizio cognitivo! :)
Leekaiinthesky,

2
+1 . (Bello sapere che ha un nome.)
Scortchi - Ripristina Monica

1
(+1) per il termine "probabilità corrispondente".
Haitao Du,

13

In sostanza stai ponendo una domanda molto interessante: dovrei prevedere usando "MAP Bayesian" Stima massima a posteriori o "Real Bayesian".

Supponiamo che tu conosca la vera distribuzione che , quindi usando la stima MAP, supponi di voler fare 100 previsioni sui prossimi 100 risultati del flip. Dovresti sempre indovinare che il lancio è coda , NON indovinare 20 testa e 80 coda. Questo si chiama "MAP Bayesian", in pratica lo stai facendoP(H)=0.22080

argmaxθf(x|θ)

Non è difficile dimostrare che così facendo è possibile ridurre al minimo l'errore previsto (perdita 0-1). La prova può essere trovata nella ~ pagina 53 di Introduzione all'apprendimento statistico .


C'è un altro modo di fare questo approccio chiamato "Bayesiano reale". Fondamentalmente non stai cercando di "selezionare il risultato con la massima probabilità, ma considera probabilisticamente tutti i casi" Quindi, se qualcuno ti chiede di "prevedere i prossimi 100" lanci, dovresti metterlo in pausa, perché quando hai dato 100 risultati binari, le informazioni probabilistiche per ciascun risultato scompaiono. Invece, dovresti chiedere, cosa vuoi fare DOPO conoscere i risultati.

Supponiamo che abbia una funzione di perdita (non necessaria alla perdita 0-1, ad esempio, la funzione di perdita può essere, se perdi una testa, devi pagare $ 1, ma se perdi una coda, devi pagare $ 5, vale a dire, perdita sbilanciata) sulla previsione, quindi è necessario utilizzare le proprie conoscenze sulla distribuzione dei risultati per ridurre al minimo le perdite sull'intera distribuzione

xyp(x,y)L(f(x),y)

, ad esempio, incorporare le tue conoscenze sulla distribuzione in perdita, invece di "modo saggio", ottenere le previsioni e fare i passi successivi.

P(S1)=0.1P(S2)=P(S3)=P(S100)=0.9/99=0.009090S190%


4
MAP è anche bayesiano. Inoltre, descrivi entrambi gli approcci senza fare riferimento in alcun modo all'uso dei priori che cosa può essere fuorviante poiché stai scrivendo sui metodi bayesiani e i priori sono la caratteristica principale di quei metodi.
Tim

'Quindi, se qualcuno ti chiedesse di "prevedere i prossimi 100" lanci, dovresti rifiutare di farlo' Se quel qualcuno mi offrisse un miliardo di euro se prevedo correttamente, probabilmente non rifiuterei. O probabilmente intendi "prevedere" con un significato diverso da "prova a indovinare".
JiK,

"quando si dato 100 risultati binari, l'informazione probabilistica per ogni risultato scompare" In un primo momento ho letto questo come "quando si è dato 100 risultati binari" e non riusciva a capire la frase, ma ora mi sono reso conto che potrebbe significare "quando si 100 risultati binari ". Quale è corretto, e se è il primo, cosa significa?
JiK,

1
Un punto molto secondario: aggiungerei probabilmente una linea verticale dopo il secondo paragrafo per indicare che i primi due paragrafi sono tecnicamente sufficienti per rispondere alla domanda letterale e il resto è in qualche modo un'informazione aggiuntiva (che è senza dubbio interessante e utile).
JiK,

2
Nell'ultimo paragrafo: "La stima MAP non funzionerà bene se il numero di risultati è elevato. - - Tuttavia sbaglierai il 90% delle volte !!" Non funzionare bene è sempre una questione di contesto. Se questo è ad esempio un gioco di scommesse ripetuto (il piatto è diviso tra persone che indovinano correttamente o sono tornate se nessuno indovina), la strategia MAP è destinata a vincere molti soldi a lungo termine se giochi contro persone che, ad esempio, fanno le loro ipotesi dalla distribuzione dei risultati.
JiK,

4

A causa dell'indipendenza, il valore delle aspettative viene sempre massimizzato se si indovina il caso più probabile. Non esiste una strategia migliore perché ogni lancio / lancio non fornisce ulteriori informazioni sulla moneta / dado.

Ovunque indovini un risultato meno probabile, la tua aspettativa di vittoria è inferiore rispetto a quando avessi indovinato il caso più probabile, quindi stai meglio indovinando il caso più probabile.

Se volessi farlo in modo da dover cambiare la tua strategia mentre lanciavi, potresti considerare una moneta / dado in cui inizialmente non conosci le probabilità e devi capirle mentre tiri.


1
per me questa risposta è la spiegazione più semplice; se dovessi definire una strategia considerando il risultato che avevi prima, questo spezzerebbe le probabilità "indipendenti".
Walfrat,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.