Esistono diverse informazioni chiave necessarie per comprendere in che modo DFT consente di spostare un'immagine.
Innanzitutto, la teoria di Fourier: probabilmente è più facile esaminare prima il caso continuo (cioè, analogico). Immagina di avere qualche funzione, chiamala g (t). Per semplicità, supponiamo che g (t) sia una registrazione audio analogica, quindi è una funzione monodimensionale, che è continua e rappresenta la pressione istantanea in funzione del tempo.
Ora, g (t) è un modo in cui possiamo rappresentare la nostra registrazione audio. Un altro è G (f). G (f) è la trasformata di Fourier di g (t). Quindi, G (f) == FT (g (t)). G (f) ha tutte le stesse informazioni di g (t), ma rappresenta tali informazioni nel dominio della frequenza anziché nel dominio del tempo. Ci sono alcuni dettagli pignoli sulle trasformazioni di Fourier, che non menzionerò.
Puoi pensare a G (f) come alla "distribuzione delle frequenze" contenuta in g (t). Quindi, se g (t) è un'onda sinusoidale (cioè un tono puro), allora G (f) sarà zero ovunque, tranne alla frequenza di quel tono. Questo è probabilmente un buon punto per menzionare che G (f) è in generale una funzione complessa - vale a dire che restituisce numeri complessi, che si può pensare di avere una componente reale e immaginaria o una grandezza e una fase.
δ( w )δ
Ok, quindi ora abbiamo FT continui sotto la nostra cintura.
Ecco la seconda intuizione: una trasformata discreta di Fourier è verso una trasformata di Fourier come un segnale campionato è verso un segnale analogico. In questo caso, il "discreto" si riferisce alla quantizzazione del dominio della funzione (tempo o frequenza), non al suo intervallo. (Il segnale digitale campionato che ricevi dalla tua scheda audio è quantizzato sia nel dominio che nell'intervallo.)
Il flusso di byte digitale che si ottiene dalla scheda audio contiene "campioni" del segnale continuo (analogico) originale dal microfono. Se prendiamo il DFT del nostro campione g (t), otteniamo ancora un G (f). G (f), ricorda, è solo un modo diverso di rappresentare le informazioni contenute in g (t). Se abbiamo obbedito alla teoria di Nyquist , il segnale campionato g (t) contiene tutta l '"intelligenza" del segnale continuo originale, quindi il nostro discreto G (f) deve contenere tutte le informazioni dal nostro segnale continuo originale. Tra parentesi, G (f) è ancora una funzione complessa.
È qui che entra in gioco la magia dello spostamento dei sub-pixel, ma in questo caso scriverò di spostare il segnale audio nel tempo di meno di un campione, poiché è la stessa cosa.
ei π2
Ciò significa che possiamo spostare la nostra registrazione audio nel tempo (di qualsiasi quantità scegliamo, inclusa una frazione del tempo di campionamento) semplicemente modificando la fase di G (t). In realtà, questa affermazione è forse un po 'troppo casuale. Per un segnale campionato non quantizzato, la fase può essere regolata arbitrariamente (questo è uno dei motivi per cui ho fatto la distinzione tra quantizzazione di dominio e intervallo prima). Tuttavia, per un segnale campionato quantizzato (il nostro flusso di byte di audio, ad esempio) la dimensione del passo di quantizzazione (cioè il numero di bit) determina la risoluzione con cui possiamo regolare la fase. Quando invertiamo la trasformata di Fourier G (f) (o DIFT, per questo segnale campionato), il nuovo set di campioni g '(t) = DIFT (G (F)) verrà spostato nel tempo della quantità che selezioniamo.
Applicarlo ai pixel significa semplicemente usare un FT bidimensionale invece del FT monodimensionale discusso qui.