L'entropia crociata è identica alla divergenza KL più entropia della distribuzione target. KL è uguale a zero quando le due distribuzioni sono uguali, il che mi sembra più intuitivo dell'entropia della distribuzione target, che è l'entropia incrociata in una partita.
Non sto dicendo che ci sono più informazioni in una delle altre tranne che una visione umana potrebbe trovare uno zero più intuitivo di un positivo. Naturalmente, di solito si usa un metodo di valutazione per vedere davvero come si verifica la classificazione. Ma la scelta dell'entropia incrociata rispetto a KL è storica?