(Sono un principiante alle statistiche. Sono un matematico e un programmatore e sto cercando di creare qualcosa di simile a un ingenuo filtro antispam bayesiano.)
Ho notato in molti luoghi che le persone tendono a scomporre il denominatore nell'equazione del Teorema di Bayes. Quindi invece di questo:
Ci viene presentato questo:
Puoi vedere che questa convenzione è usata in questo articolo di Wikipedia e in questo post perspicace di Tim Peters.
Sono sconcertato da questo. Perché il denominatore è suddiviso in questo modo? In che modo aiuta le cose? Cosa c'è di così complicato nel calcolare , che nel caso dei filtri antispam sarebbe ?The probability that the word "cheese" appears in an email, regardless of whether it's spam or not