Su un altro thread c'è una risposta molto più ampia di @gung che affronta anche problemi tecnici correlati come il odds ratio, ma ho intenzione di attenermi all'argomento in questione: come interpretare le probabilità, e in particolare la formulazione "da a b ". Come domanda per i principianti, vale la pena di pensare a come le "probabilità" siano espresse nel discorso quotidiano (specialmente nel linguaggio delle scommesse) e anche quali siano le probabilità per uno statistico, perché le discrepanze tra i due sono problematiche per gli studenti.ab
Per le probabilità espresse da uno statistico , la tua tesi è corretta. Supponiamo che una borsa contenga quattro token, di cui tre sono e uno marrone , e un token è selezionato a caso. La probabilità che il token selezionato sia acquamarina è 3 su 4, ovvero 3aquamarinebrown , leggi spesso "3 in 4". Con risultati ugualmente probabili, leprobabilitàper l'acquamarina sarebbero calcolate come il numero di risultati favorevoli (3) diviso per il numero di risultati sfavorevoli (1), che è334, spesso letto cometre a unoo semplicemente come il numero "tre". Più in generale, si potrebbe prendere la frazione di "esiti favorevoli su esiti sfavorevoli" e cancellare (dividere) sia il numeratore che il denominatore per il numero totale di esiti, per ottenere "la probabilità di un esito favorevole rispetto alla probabilità di un esito sfavorevole", da cui una piccola algebra dà:31=3three to one
Odds=p1−p⟹p=Odds1+Odds
Le probabilità espresse da un bookmaker sono di solito indicate come "quote contro" o "quote su", e il modo in cui sono scritte sembra essere una causa comune di confusione. Nelle cosiddette quote britanniche , quote frazionarie o quote tradizionali , le quote per l'acquamarina sarebbero scritte "3/1 su" o "3-1 su", lette come . * Per un giocatore d'azzardo, il fatto che queste sono "odds on" indica che una puntata di £ 3 sull'acquamarina restituirebbe un profitto di £ 1 in caso di successo (in realtà ricevono £ 4, di cui £ 3 è semplicemente il ritorno della puntata originale) mentre una scommessa fallita comporta la perdita del £ 3 di puntata. Possiamo vedere che si tratta di " discrete probabilitàthree to one on"perché il giocatore ha tre possibilità di guadagnare £ 1 e una possibilità di perdere £ 3, quindi in media non ci sono guadagni o perdite previsti. Finora, così poca discrepanza: le" probabilità su "sono semplicemente le" probabilità a favore "preferite dagli statistici.
Per eventi con una probabilità del 50%, come ad esempio un lancio di una moneta - due risultati ugualmente probabili di successo o fallimento - uno statistico direbbe che le probabilità sono "uno a uno", o semplicemente1mentre un bookmaker equo darebbe quote frazionarie di 1/1 (leggi come "pari"). Quindi nessun problema neanche qui; tuttavia, quando la probabilità scende al di sotto del 50%, vediamo che il bookmaker riprende citando il numero più grande nel rapporto prima di quello più piccolo.111
Considera una razza in cui tutti e quattro i cavalli (diciamo F oinavon , G regalach , M on Mome e T ipperary Tim ) hanno la stessa probabilità di vincere: quindi in termini di probabilità , si direbbe che ciascuno avesse un "1 in 4" o 0,25 possibilità di vittoria. Quali sarebbero le probabilità giuste per una scommessa su, diciamo, Foinavon? C'è solo un risultato favorevole (vittoria per F) rispetto a tre risultati sfavorevoli (vittoria per G, M o T), quindi uno statista descriverà le probabilità come "1 a 3", o numericamente come . Tuttavia, un bookmaker che utilizza le quote britanniche vedrebbe le quote come "3 a 1 contro" e le scriverà semplicemente come "3/1" o 3-1 "(entrambi leggono" tre a uno ";il" contro "è implicito e non viene detto). Per un giocatore d'azzardo, "probabilità contro" significa che una puntata di £ 1 restituirebbe un guadagno di £ 3 in caso di successo (riceveranno effettivamente £ 4, ma £ 1 di questo è il ritorno della puntata originale) mentre se non hanno successo perdere la puntata di £ 1. Il giocatore ha tre possibilità di perdere £ 1 e una possibilità di guadagnare £ 3, quindi ancora una volta ci sono zero profitti / perdite attesi e le probabilità sono giuste. Purtroppo, "probabilità contro" (la solita forma di probabilità ) non corrisponde alle "probabilità a favore" di uno statistico.13
Ogni cavallo della nostra ipotetica razza ha raggiunto la fama una volta vincendo il Grand National con una probabilità di 100/1: dato che si trattava di quote alte ("lunghe") contro , erano " tiri lunghi " considerati estremamente improbabili per vincere, e i loro sostenitori erano generosamente premiato con £ 100 di profitto per sterlina scommessa. Se facciamo finta che le probabilità dei bookmaker fossero le probabilità giuste (che ignorerebbe il overround del bookmaker, o "vig" ), si pensava che c'erano 100 modi in cui il cavallo poteva perdere per ogni modo in cui il cavallo poteva vincere, quindi la probabilità implicita di successo è stato . Al contrario, se unostatistico haaffermato che un evento aveva probabilità di "100 a 1", si tratta di un'affermazione che èmolto probabile(con una probabilità di1001101 ).100101
Se il laico del tuo pubblico proviene da un paese in cui i bookmaker utilizzano quote frazionarie e regolarmente citato dai media (ad esempio "Jeremy Corbyn si battere 100-1 quote per diventare leader del partito laburista britannico", The Guardian , 11 settembre 2015; "11 milioni a uno: vitelli quadruplet nati nel sud dell'Australia", Sydney Morning Herald , 30 luglio 2015), quindi citare quote nella forma "da a b " è quasi certo che causerà confusione.ab
Ho visto persone provare questo, forse nella convinzione che "il pubblico in generale ha più familiarità con le probabilità che con le probabilità", ma gli statistici saggi nei confronti del bookmaker, e che quindi non hanno mai scommesso nella loro vita, potrebbero essere presi da sorpresa che la concezione popolare delle probabilità sia "il modo sbagliato". Se si ritiene che questa confusione superi i vantaggi del "formulazione a a b " (in particolare che rende chiare le probabilità esprimono unrapportofavorevole o sfavorevole), potrebbe essere meglio esprimere "probabilità statistiche" come un singolo numero, per distinguere loro dalle probabilità frazionarie di un bookmaker. Prima di presentare quote statistiche a tale pubblico, vorrei almeno renderle consapevoli dei seguenti punti:ab
- Le probabilità di uno statistico corrispondono alle "probabilità su" di un bookmaker. Se sei abituato alle "probabilità contro", le probabilità di uno statistico possono sembrare "il modo sbagliato". Ad esempio, "10 a 1" indica un evento molto probabile e "1000 a 1" uno molto probabile!
- 25
- Mentre i bookmaker preferiscono dare le probabilità come rapporto di numeri interi, ** gli statistici spesso semplificheranno le loro probabilità nella forma "qualcosa a uno", anche se questo introduce un decimale (es. "5 a 2" diventa "2,5 a 1") .
- 79
- Su questa scala, le probabilità zero rappresentano un'impossibilità; le probabilità tra 0 e 1 indicano una probabilità inferiore a pari; le probabilità di 1 mostrano una probabilità del 50%; le probabilità sopra 1 indicano che l'evento è più probabile che no; un certo evento avrebbe infinite probabilità.
Matematicamente, abbiamo
Oddsstatistician=Odds onBritish;Oddsstatistician=1Odds againstBritish
1.332.004.00OddsEuropean=1p
Oddsstatistician=p1−p=1p−1−1=1OddsEuropean−1
We might also have deduced this from noting OddsEuropean=Odds againstBritish+1 (because of European odds including the return of the stake in the payout).
European odds have several advantages to the gambler. Comparing two fractional odds (try 8/15 versus 4/7) involves greater feats of mental arithmetic than comparing two decimals. Small changes to the implied probability work "smoothly" for a decimal whereas the form of a fraction may have to completely change as a different denominator is required. Calculating the payout from a win is as simple as multiplying the stake by the European odds (e.g. a winning stake of €300 at European odds of 1.50 receives a payout of €450, of which €150 is profit). The reciprocal relationship with implied probability is especially useful for spotting "value bets": if a gambler believes the true probability of success on a bet at European odds of 6.00 is greater than the bet's implied probability of 16, the bet is good value and the gambler's expected profit is positive.
However, it's harder for a statistician to explain mathematical odds to a layperson accustomed to European odds! Like British "odds against", higher European odds indicate an event that's deemed less likely (1.00 for a certainty, 2.00 for an even chance, ∞ for an impossibility). Even worse, the numbers are not simply the "wrong way round" but completely misleading: the entire concept of a ratio of favourable and unfavourable outcomes has been lost.
This key conceptual ratio is retained in the moneyline system used in US sports betting, even though it looks more complex at first sight. Positive figures indicate profit (excludes return of stake) on a winning $100 stake, essentially the same idea as "odds against". A figure of +300 indicates $300 of profit on a $100 stake, equivalent to "3/1 [against]" in the British system or "1 to 3" for a statistician (the Foinavon bet). Negative figures indicate the required stake to win a profit of $100, equivalent to "odds on". A figure of -300 shows a $300 stake makes $100 profit, which is "3/1 on" in the British system or "3 to 1" for a statistician (the aquamarine bet).
Oddsstatistician=⎧⎩⎨⎪⎪|Moneyline|100100Moneylineif Moneyline<0if Moneyline>0
I appreciate much of this answer has concerned betting and pay-offs rather than statistics, but I've found the everyday usage of "odds" differs so markedly from the statistician's technical definition, that a thorough comparison might address some confusion (both of non-technical gamblers, and non-gambling statisticians). There are, of course, deep historical and philosophical links between betting and statistics. The problem of points concerned the fair division of the prize pot in an interrupted gambling game, and had generated discussion since medieval times. When Antoine Gombaud, chevalier de Méré posed a version of the problem in 1654, the subsequent correspondence of Blaise Pascal and Pierre de Fermat on the issue laid the foundations of probability theory. More recently, Frank Ramsey (in the 1920s) and Bruno de Finetti (in the 1930s) examined the coherence of wagers (related to the gambling phenomenon of a Dutch book) as a justification of Bayesian probability: if an agent's subjective probabilities or degrees of belief do not obey the axioms of probability, then they are incoherent and a Dutch book can be made against the agent, exposing them to a certain loss. The Stanford Encyclopedia of Philosophy has an article on the "Dutch Book argument".
(∗) I've deliberately oversimplified here for pedagogical purposes. In fact bookmakers are not consistent on this point: these odds may well be written "1/3" (signifying "one to three against"), though this may still be read aloud as "three to one on"! However, while a bookmaker might write the smaller number first in an odds against bet, they will never frame an odds on bet in this way: "1/3 on" would theoretically be the same as "3/1 [against]", but in practice would always be quoted in the latter form.
(∗∗) As an aside, bookmakers do not always cancel these whole numbers to their lowest terms: "6/4" is often advertised ("ear'ole"), so perhaps bookmakers believe a £6 profit on a £4 stake is more psychologically enticing than the prospect of £3 profit on a £2 stake. I have heard it argued, though the truth I know not, that "100/30" survives because "10 to 3" could be mistaken for the time of a race. Hong Kong odds are fractional odds (against) cancelled down to a single number, so "5/2 against" becomes 2.5; the profit from a winning bet (excluding return of the stake) is then the Hong Kong odds multiplied by the stake. Hong Kong odds below one indicate a greater than 50% chance; they are the reciprocal of statistical odds.