Risposte:
Si desidera eseguire il ritaglio gradiente quando si riscontra il problema di sfumature sfumate o esplosione di sfumature. Tuttavia, per entrambi gli scenari, esistono soluzioni migliori:
Il gradiente di esplosione si verifica quando il gradiente diventa troppo grande e si ottiene un overflow numerico. Questo può essere facilmente risolto inizializzando i pesi della rete su valori più piccoli. Se questo non funziona, è probabile che ci sia un bug nel codice.
Il gradiente di fuga si verifica quando l'ottimizzazione si blocca in un punto di sella, il gradiente diventa troppo piccolo per consentire all'ottimizzazione di progredire. Questo può essere risolto usando la discesa gradiente con momentum o prop RMS o entrambi (noto anche come ottimizzatore Adam).
I valori iniziali per il limite superiore del ritaglio gradiente sarebbero qualcosa di più piccolo del numero più grande che la variabile può assumere. Per il limite inferiore, direi che è specifico del problema, ma forse inizia con qualcosa come 1e-10.