L'idea di convoluzione
La mia esposizione preferita sull'argomento è in una delle lezioni di Brad Osgood sulla trasformata di Fourier . La discussione sulla convoluzione inizia intorno alle 36:00, ma l'intera lezione ha un contesto aggiuntivo che vale la pena guardare.
L'idea di base è che, quando si definisce qualcosa come la trasformata di Fourier, piuttosto che lavorare sempre direttamente con la definizione, è utile derivare proprietà di livello superiore che semplificano i calcoli. Ad esempio, una di queste proprietà è che la trasformazione della somma di due funzioni è uguale alla somma delle trasformazioni, vale a dire
F{f+g}=F{f}+F{g}.
Ciò significa che se si dispone di una funzione con una trasformazione sconosciuta e può essere scomposta come somma di funzioni con trasformazioni note, in pratica si ottiene la risposta gratuitamente.
Ora, poiché abbiamo un'identità per la somma di due trasformazioni, è una domanda naturale chiedersi quale sia l'identità per il prodotto di due trasformazioni, vale a dire
F{f}F{g}= ?.
Si scopre che quando si calcola la risposta, la convoluzione è ciò che appare. L'intera derivazione è data nel video e, poiché la tua domanda è per lo più concettuale, non la riassumerò qui.
L'implicazione dell'avvicinarsi alla convoluzione in questo modo è che è una parte intrinseca del modo in cui la trasformata di Laplace (di cui la Tranform di Fourier è un caso speciale) trasforma equazioni differenziali ordinarie lineari a coefficiente costante (LCCODE) in equazioni algebriche. Il fatto che una simile trasformazione sia disponibile per rendere trattabile analiticamente LCCODE è una grande parte del motivo per cui sono studiati nell'elaborazione del segnale. Ad esempio, per citare Oppenheim e Schafer :
Poiché sono relativamente facili da caratterizzare matematicamente e poiché possono essere progettati per svolgere utili funzioni di elaborazione del segnale, la classe dei sistemi lineari invarianti di spostamento verrà studiata approfonditamente.
Quindi una risposta alla domanda è che se stai usando metodi di trasformazione per analizzare e / o sintetizzare i sistemi LTI, prima o poi, sorgerà una convoluzione (implicitamente o esplicitamente). Si noti che questo approccio all'introduzione della convoluzione è molto standard nel contesto delle equazioni differenziali. Ad esempio, vedi questa lezione del MIT di Arthur Mattuck . La maggior parte delle presentazioni o presenta l'integrale di convoluzione senza commenti, quindi ne ricava le proprietà (cioè estraendolo da un cappello), oppure orlo e falco sulla strana forma dell'integrale, parla di capovolgere e trascinare, invertire il tempo, ecc., Ecc. .
La ragione per cui mi piace l'approccio del Prof. Osgood è che evita tutto quello tsouris, oltre a fornire, secondo me, una profonda comprensione di come i matematici probabilmente sono arrivati all'idea in primo luogo. E cito:
Dissi: "Esiste un modo per combinare F e G nel dominio del tempo, in modo che nel dominio della frequenza gli spettri si moltiplichino, le trasformazioni di Fourier si moltiplichino?" E la risposta è, sì, c'è, con questo integrale complicato. Non è così ovvio. Non ti alzi dal letto la mattina e scrivi questo, e ti aspetti che questo risolva il problema. Come lo otteniamo? Hai detto, supponi che il problema sia risolto, vedi cosa deve succedere e quindi dovremmo riconoscere quando è il momento di dichiarare la vittoria. Ed è tempo di dichiarare la vittoria.
Ora, essendo un odioso matematico, copri le tue tracce e dici: "Bene, ho semplicemente intenzione di definire la convoluzione di due funzioni con questa formula".
Sistemi LTI
Nella maggior parte dei testi DSP, la convoluzione viene generalmente introdotta in un modo diverso (che evita qualsiasi riferimento ai metodi di trasformazione). Esprimendo un segnale di ingresso arbitrario come somma di impulsi di unità scalati e spostati,x(n)
x(n)=∑k=−∞∞x(k)δ(n−k),(1)
dove
δ(n)={0,1,n≠0n=0,(2)
le proprietà di definizione dei sistemi lineari invarianti di tempo conducono direttamente una somma di convoluzione che coinvolge la risposta all'impulso . Se il sistema definito da un operatore LTI L è espresso come y ( n ) = L [ x ( n ) ] , applicando le proprietà repettive, vale a dire la linearitàh(n)=L[ δ(n) ]Ly(n)=L[ x(n) ]
L[ ax1(n)+bx2(n) ]Transform of the sum of scaled inputs=aL[ x1(n) ]+bL[ x2(n) ]Sum of scaled transforms,(3)
e invarianza tempo / turno
L[ x(n) ]=y(n) −→−−−impliesL[ x(n−k) ]=y(n−k),(4)
il sistema può essere riscritto come
y(n)=L[∑k=−∞∞x(k)δ(n−k)]Tranform of the sum of scaled inputs=∑k=−∞∞x(k)L[δ(n−k)]Sum of scaled transforms=∑k=−∞∞x(k)h(n−k).Convolution with the impulse response
Questo è un modo molto standard per presentare la convoluzione, ed è un modo perfettamente elegante e utile per farlo. Derivazioni simili si possono trovare in Oppenheim e Schafer , Proakis e Manolakis , Rabiner e Gold , e ne sono sicuro molti altri. Alcuni approfondimenti [che vanno oltre le introduzioni standard] sono forniti da Dilip nella sua eccellente risposta qui .
Si noti, tuttavia, che questa derivazione è in qualche modo un trucco magico. Dando un'altra occhiata a come il segnale è decomposto in , possiamo vedere che è già sotto forma di una convoluzione. Se(1)
(f∗g)(n)f convolved with g=∑k=−∞∞f(k)g(n−k),
allora è solo x ∗ δ . Poiché la funzione delta è l' elemento di identità per la convoluzione, dire che qualsiasi segnale può essere espresso in quella forma è molto simile a dire che qualsiasi numero n può essere espresso come n + 0 o n × 1 . Ora, scegliere di descrivere i segnali in quel modo è geniale perché porta direttamente all'idea di una risposta all'impulso - è solo che l'idea di convoluzione è già "inserita" nella decomposizione del segnale.(1)x∗δnn+0n×1
Da questa prospettiva, la convoluzione è intrinsecamente correlata all'idea di una funzione delta (ovvero è un'operazione binaria che ha la funzione delta come elemento di identità). Anche senza considerare la sua relazione con la convoluzione, la descrizione del segnale dipende fondamentalmente dall'idea della funzione delta. Quindi la domanda diventa: da dove abbiamo preso l'idea per la funzione delta? Per quanto ne so, risale almeno al documento di Fourier sulla teoria analitica del calore, dove appare implicitamente. Una fonte per ulteriori informazioni è questo articolo su Origine e storia della convoluzione di Alejandro Domínguez.
Ora, questi sono i due principali approcci all'idea nel contesto della teoria dei sistemi lineari. Uno favorisce la comprensione analitica e l'altro favorisce la soluzione numerica. Penso che entrambi siano utili per un quadro completo dell'importanza della convoluzione. Tuttavia, nel caso discreto, trascurando completamente i sistemi lineari, c'è un senso in cui la convoluzione è un'idea molto più antica.
Moltiplicazione polinomiale
Una buona presentazione dell'idea che la convoluzione discreta sia solo una moltiplicazione polinomiale è data da Gilbert Strang in questa lezione che inizia intorno alle 5:46. Da quella prospettiva, l'idea risale all'introduzione di sistemi numerici posizionali (che rappresentano i numeri implicitamente come polinomi). Poiché la trasformata Z rappresenta segnali come polinomi in z, anche in questo contesto sorgerà una convoluzione, anche se la trasformata Z viene definita formalmente come un operatore di ritardo senza ricorrere ad analisi complesse e / o come caso speciale di Laplace Trasforma .