Teoria dietro Linear Predictive Coding (LPC)


9
  • Qual è la teoria alla base di LPC?
  • Perché alcune implementazioni di LPC sono state ritenute più tolleranti rispetto alla quantizzazione degli errori di trasmissione o codifica rispetto ad altri schemi di codifica vocale compressi?

  • I metodi LPC possono essere utilizzati anche per livellare o "prevedere" a breve termine simile all'uso dei metodi di filtro Kalman?

  • In quali condizioni o vincoli è valido l'uso di LPC?

"Perché LPC (è stato) ritenuto più tollerante nei confronti degli errori di trasmissione o codifica rispetto ad altri schemi di codifica vocale compressi?" Chi ha detto questo? Non conosco molto bene LPC, ma ho pensato che avesse a che fare con la riduzione della ridondanza, che avrebbe avuto l'effetto opposto.
endolito

Questa domanda è fuorviante in quanto falsa premessa. Chiudi e correggi questo.
Dipan Mehta,

Ci sono più domande e premesse qui. Quale (s) pensi che necessiti di riparazione?
hotpaw2,

1
L'affermazione Why are(were) certain implementations of LPC said to be more tolerant of transmission or encoding errors quantization than other compressed voice encoding schemes?è piuttosto falsa. Puoi citare qualche riferimento che dice specificamente cosa c'è di meglio rispetto agli altri?
Dipan Mehta,

1
Questa è in realtà la mia domanda. L'ho sentito da qualche parte, ma non so perché questo potrebbe essere stato affermato.
hotpaw2,

Risposte:


14

Innanzitutto, dire che la codifica predittiva lineare (LPC) è "più tollerante nei confronti degli errori di trasmissione o di codifica" non è del tutto vero. La forma in cui vengono trasmessi i coefficienti fa una grande differenza. Ad esempio, se i coefficienti di predizione lineare vengono risolti, possono essere molto sensibili alla quantizzazione, proprio come i coefficienti di filtro IIR di alto ordine (questo perché il filtro di sintesi sarà IIR, ma ne parleremo più avanti). Tuttavia, se vengono trasmessi in qualche altra forma, questo problema può essere mitigato facilmente.

Un modo è trasferire i coefficienti di riflessione. Se si risolve ricorsivamente per un filtro di previsione lineare del K-esimo ordine, il coefficiente di ordine più alto in ogni fase viene chiamato coefficiente di riflessione. Questi possono essere usati insieme per caratterizzare completamente il sistema (che può essere facilmente visto dalla ricorsione di Levinson). In effetti, puoi usarli tutti insieme per formare un filtro reticolare. Questi filtri vengono spesso utilizzati quando la quantizzazione è un problema, poiché sono molto più robusti per i conteggi di bit bassi. Inoltre, se l'entità di questi coefficienti di riflessione è limitata dall'unità, si garantisce un filtro stabile BIBO che è fondamentale per LPC in cui il filtro viene utilizzato per sintetizzare il segnale. Esistono altri metodi come le coppie spettrali di linea che vengono frequentemente utilizzate, ma non sono

Ora, per rispondere alla prima domanda, la teoria dell'LPC ruota attorno alla modellazione del tratto vocale. In sostanza, stiamo modellando il discorso come vibrazione dell'aria come input per un tubo di una certa struttura. Puoi cercare alcune risorse che vanno molto più in dettaglio per arricchire questo modello (lunghezza dei tubi, intensità dell'aria, struttura ecc.). Queste risorse mettono in relazione queste strutture direttamente con i filtri IIR che rispondono a vari stimoli, ad esempio il rumore bianco.

Quindi, quando risolviamo i coefficienti di predizione lineare, stiamo cercando i coefficienti in modo tale che se immettiamo il nostro segnale (voce per esempio) in un filtro FIR creato dai coefficienti, otteniamo rumore bianco come uscita. Quindi pensa a cosa significa. Stiamo introducendo un altamentesegnale correlato e emissione di una sequenza di rumore bianco. Quindi, in effetti, stiamo rimuovendo tutta la dipendenza lineare di quel segnale. Un altro modo di vedere questo è che tutte le informazioni significative sono contenute nei coefficienti che rimuovono questa dipendenza lineare. Pertanto, possiamo trasferire questi coefficienti (o una loro forma come sopra) e l'estremità ricevente può ricreare il segnale. Questo viene fatto invertendo il filtro FIR predittivo lineare per creare un filtro IIR e immettendo rumore bianco. Quindi la compressione arriva rimuovendo questa dipendenza lineare e trasferendo i coefficienti. Questo è il motivo per cui il metodo Burg viene talvolta definito anche il metodo della massima entropia, poiché mira a massimizzare la "casualità" o il candore del rumore di uscita nel filtro di previsione lineare. Un altro modo di vedere questo,

Per rispondere alla tua ultima domanda, non sono sicuro di quello che stai chiedendo del tutto. LPC o codifica predittiva lineare intende "comprimere" il segnale supponendo che possa essere modellato in modo efficiente come precedentemente discusso. Puoi certamente usare la previsione lineare per fare "previsione a breve termine" come hai già detto. Questa è la base implicita dietro i metodi AR ad alta risoluzione utilizzati per la stima della densità spettrale di potenza. La sequenza di autocorrelazione può essere estesa in modo ricorsivo dalla sua forma finita dal set di dati limitato all'infinito come sequenza di autocorrelazione teorica della sequenza non vista. Questo è anche il motivo per cui i metodi AR per la stima della PSD non presentano fenomeni collaterali.


1
"la teoria dell'LPC ruota attorno alla modellistica del tratto vocale" È sempre vero? FLAC utilizza LPC su forme d'onda audio generiche, non solo vocali.
endolito

3
Mi scuso, inizialmente l'ho imparato attraverso l'analogia delle corde vocali come modello fisico da cui proviene. Come ho detto, ci sono posti in cui approfondiscono questo aspetto molto più in profondità. Ma hai ragione, LPC è adatto per forme d'onda audio generiche. Come ho già detto, funziona bene su qualsiasi spettro impulsivo. Come corollario, funziona male sui segnali rumorosi in cui lo spettro è meno impulsivo (questo perché i segnali rumorosi sono meglio modellati come processi ARMA).
Bryan,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.