Un predittore Naive Bayes fa le sue previsioni usando questa formula:
dove è un fattore normalizzante. Ciò richiede la stima dei parametri dai dati. Se lo facciamo con smoothing, otteniamo la stimaP ( X i = x i | Y = y ) k
dove ci sono possibili valori per . Sto bene con questo. Tuttavia, per il precedente, abbiamoX i
dove ci sono esempi nel set di dati. Perché non levigiamo anche il precedente? O meglio, cosa si liscia il preventivo? In tal caso, quale parametro di smoothing scegliamo? Sembra anche leggermente sciocco scegliere anche , poiché stiamo facendo un calcolo diverso. C'è un consenso? O non importa troppo?