C'è qualche letteratura che elenca le caratteristiche degli algoritmi che consentono loro di essere spiegabili?
L'unica letteratura di cui sono a conoscenza è il recente articolo di Ribero, Singh e Guestrin. Definiscono innanzitutto la spiegabilità di una singola previsione:
"Spiegando una previsione", intendiamo presentare artefatti testuali o visivi che forniscono una comprensione qualitativa della relazione tra i componenti dell'istanza (ad esempio parole nel testo, patch in un'immagine) e la previsione del modello.
Gli autori elaborano ulteriormente cosa ciò significhi per esempi più concreti, e quindi usano questa nozione per definire la spiegabilità di un modello. Il loro obiettivo è provare e, per così dire, aggiungere la spiegabilità artificialmente a modelli altrimenti intransparenti, piuttosto che confrontare la spiegabilità dei metodi esistenti. Il documento può essere comunque utile, in quanto cerca di introdurre una terminologia più precisa attorno al concetto di "spiegabilità".
Esistono comunemente modelli di apprendimento automatico che rappresentano un buon compromesso tra i due?
Concordo con @Winter che la rete elastica per la regressione (non solo logistica) può essere vista come un esempio per un buon compromesso tra accuratezza della previsione e spiegabilità.
Per un diverso tipo di dominio dell'applicazione (serie temporali), un'altra classe di metodi fornisce anche un buon compromesso: la modellazione bayesiana delle serie temporali strutturali. Eredita la spiegabilità dalla classica modellazione strutturale delle serie storiche e una certa flessibilità dall'approccio bayesiano. Simile alla regressione logistica, la spiegabilità è aiutata dalle equazioni di regressione utilizzate per la modellazione. Vedi questo documento per una bella applicazione nel marketing e ulteriori riferimenti.
Relativamente al contesto bayesiano appena menzionato, potresti anche voler esaminare modelli grafici probabilistici. La loro spiegabilità non si basa sulle equazioni di regressione, ma sui modi grafici di modellizzazione; vedere "Modelli grafici probabilistici: principi e tecniche" di Koller e Friedman per una panoramica eccezionale.
Non sono sicuro se possiamo fare riferimento ai metodi bayesiani sopra come un "buon compromesso generalmente accettato". Potrebbero non essere sufficientemente noti per questo, soprattutto se confrontati con l'esempio della rete elastica.