Ho una serie di canzoni per le quali ho estratto la STFT (Short-Time Fourier Transform) e usato lo spettro di grandezza per calcolare lo spettrogramma mel usando una matrice bank bank mel , così . Voglio sapere che esiste un metodo per invertire questo processo, ovvero convertire dallo spettrogramma mel allo spettrogramma. Ho eseguito una riduzione della dimensionalità sullo spettrogramma mel e ho ricostruito lo spettrogramma mel da dimensioni inferiori. Ora voglio rigenerare il segnale audio dallo spettrogramma mel ricostruito, quindi immagino prima di ricostruire lo spettrogramma e poi il segnale audio.
Il problema è che la matrice del banco del filtro mel non è una matrice quadrata, poiché riduciamo il no dei bin di frequenza, quindi al contrario non può essere usato in questo modo: . Quindi esiste un modo per generare la mappatura inversa, come una funzione di trasferimento inversa da cui è possibile convertire per ?