Sfortunatamente, la risposta ora accettata da @Sycorax, sebbene dettagliata, non è corretta.
In realtà, un primo esempio di regressione attraverso l'entropia incrociata categorica - Wavenet - è stato implementato in TensorFlow .
Il principio è che discretizzi il tuo spazio di output e quindi il tuo modello prevede solo il rispettivo bin; vedere la Sezione 2.2 del documento per un esempio nel dominio della modellazione del suono. Quindi, mentre tecnicamente il modello esegue la classificazione, l'eventuale compito risolto è la regressione.
Un aspetto negativo evidente è che si perde la risoluzione di output. Tuttavia, questo potrebbe non essere un problema (almeno penso che l'assistente artificiale di Google abbia parlato in modo molto umano ) o puoi giocare con un po 'di post-elaborazione, ad esempio l'interpolazione tra il cestino più probabile e i suoi due vicini.
D'altro canto, questo approccio rende il modello molto più potente rispetto al solito output a unità singola lineare, ovvero consentendo di esprimere previsioni multimodali o di valutarne la fiducia. Si noti tuttavia che quest'ultimo può essere naturalmente ottenuto con altri mezzi, ad esempio avendo un output di varianza esplicito (log) come nei codificatori automatici variabili.
Ad ogni modo, questo approccio non si adatta bene all'output tridimensionale, perché quindi la dimensione del layer di output cresce esponenzialmente, rendendolo un problema sia computazionale che di modellazione.