Cosa indica il dominio della frequenza in caso di immagini?


110

Stavo solo imparando a conoscere il dominio della frequenza nelle immagini.

Riesco a capire lo spettro delle frequenze in caso di onde. Indica quali frequenze sono presenti in un'onda. Se disegniamo lo spettro di frequenza di , otteniamo un segnale di impulso a e . E possiamo usare i filtri corrispondenti per estrarre informazioni particolari.cos(2πft)f+f

Ma cosa significa spettro di frequenza in caso di immagini? Quando prendiamo la FFT di un'immagine in OpenCV, otteniamo una strana immagine. Cosa indica questa immagine? E qual è la sua applicazione?

Ho letto alcuni libri, ma danno molte equazioni matematiche piuttosto che implicazioni fisiche. Quindi qualcuno può fornire una semplice spiegazione del dominio della frequenza nelle immagini con una sua semplice applicazione nell'elaborazione delle immagini?


5
Il modo migliore per capire cosa fa una trasformazione è giocare con l'alimentazione di input semplici alla trasformazione inversa .
endolith

1
Vedi anche questa interessante spiegazione di Steve Eddins blogs.mathworks.com/steve/2009/12/04/…
Alessandro Jacopson

@endolith Yeah! hai bisogno di alcune conoscenze sul dominio in anticipo per capire appieno cosa sta succedendo e perché sta accadendo ..
SIslam

caro il dominio di frequenza dell'immagine rappresenta l'intensità di potenza in watt rispetto alla certa frequenza in hertiz come (componente cc, bassa frequenza e alta frequenza)
mntaser

Risposte:


93

Ma cosa significa spettro di frequenza in caso di immagini?

Le "equazioni matematiche" sono importanti, quindi non saltarle del tutto. Ma anche la 2d FFT ha un'interpretazione intuitiva. Per esempio, ho calcolato la FFT inversa di alcune immagini di esempio:

inserisci qui la descrizione dell'immagine

Come puoi vedere, nel dominio della frequenza è impostato solo un pixel. Il risultato nel dominio dell'immagine (ho visualizzato solo la parte reale) è un "modello di coseno ruotato" (la parte immaginaria sarebbe il seno corrispondente).

Se imposto un pixel diverso nel dominio della frequenza (sul bordo sinistro):

inserisci qui la descrizione dell'immagine

Ottengo un diverso schema di frequenza 2d.

Se imposto più di un pixel nel dominio della frequenza:

inserisci qui la descrizione dell'immagine

ottieni la somma di due coseni.

Quindi, come un'onda 1d, che può essere rappresentata come una somma di seni e coseni, qualsiasi immagine 2d può essere rappresentata (parlando in senso lato) come una somma di "seni e coseni ruotati", come mostrato sopra.

quando catturiamo un'immagine in opencv, otteniamo una strana immagine. Cosa indica questa immagine?

Indica le ampiezze e le frequenze dei seni / coseni che, se sommati, ti daranno l'immagine originale.

E qual è la sua applicazione?

Ce ne sono davvero troppi per nominarli tutti. La correlazione e la convoluzione possono essere calcolate in modo molto efficiente utilizzando una FFT, ma si tratta più di un'ottimizzazione, per questo non si "guarda" al risultato della FFT. È usato per la compressione delle immagini, perché i componenti ad alta frequenza sono di solito solo rumore.


3
puoi specificare quale parte ad alta frequenza e quale parte a bassa frequenza nell'immagine del dominio della frequenza?
Abid Rahman K

4
@arkiaz: Nelle immagini che ho mostrato, la frequenza più alta è al centro dell'immagine, la frequenza più bassa (ovvero la media dell'immagine di input) è il pixel in alto a sinistra nel risultato FFT. Questo è ciò che ti offre la maggior parte delle implementazioni FFT. Se si visualizza il risultato FFT, è comune spostare la frequenza più bassa al centro dell'immagine visualizzata.
Niki Estner

1
@Mohammad: ho usato la InverseFourierfunzione di Mathematica . Octave / Matlab ifft2non fa lo stesso?
Niki Estner

1
@JimClay Per le immagini a colori, in realtà consiglierei di usare il dominio YUV . Y = intensità assoluta e UV = colore. Anche per le immagini a colori, la maggior parte delle informazioni che ti interessano si trova nella porzione di intensità dell'immagine. Usi tutti gli stessi strumenti matematici, ricorda solo di tornare indietro.
Atav32,

4
Sarebbero fantastici come animazioni, come spostare il punto e mostrare come le onde cambiano larghezza e angolo
endolith

29

Penso che questo sia stato inserito molto bene nella nota "guida DSP" ( capitolo 24, sezione 5 ):

L'analisi di Fourier viene utilizzata nell'elaborazione delle immagini più o meno allo stesso modo dei segnali monodimensionali. Tuttavia, le immagini non hanno le loro informazioni codificate nel dominio della frequenza, rendendo le tecniche molto meno utili. Ad esempio, quando viene trasformata la trasformata di Fourier di un segnale audio, la forma d'onda confusa del dominio del tempo viene convertita in uno spettro di frequenza di facile comprensione.

In confronto, prendere la trasformata di Fourier di un'immagine converte le informazioni semplici nel dominio spaziale in una forma confusa nel dominio della frequenza. In breve, non aspettarti che la trasformata di Fourier ti aiuti a comprendere le informazioni codificate nelle immagini.

Quindi, naturalmente, c'è una struttura e un significato dietro il modello apparentemente casuale ottenuto prendendo il DFT di un'immagine tipica (come nell'esempio seguente), ma non è in una forma che il cervello umano è pronto a capire intuitivamente, almeno per quanto riguarda la percezione visiva.

Imgur

Ecco un'altra esposizione interessante e abbastanza leggibile di ciò che è contenuto in una trasformata di Fourier di un'immagine e di come può essere interpretato. Ha una serie di immagini che rendono abbastanza chiaro quale sia la corrispondenza tra la trasformata di Fourier e l'immagine originale.

modifica: dai un'occhiata anche a questa pagina , che dimostra - vicino alla fine - come la maggior parte delle informazioni percettivamente importanti di un'immagine è memorizzata nella componente di fase (angolo) della rappresentazione di frequenza.

modifica 2: un altro esempio del significato di fase e grandezza nella rappresentazione di Fourier: "Sezione 3.4.1, Importanza di fase e grandezza" del libro di testo di TU Delft " Fondamenti di elaborazione delle immagini " lo dimostra chiaramente:

Imgur


Hey! Ho provato a seguire il secondo link nella tua domanda ( "un'altra esposizione interessante e abbastanza leggibile ..." ) ma il link non funziona. Ho anche provato il link fornito nei commenti, ma non funziona. Potresti trovare e modificare un link funzionante per favore?
penelope,

@penelope sei la seconda persona a notare problemi con il link (vedi il mio commento precedente). La pagina sembra essere instabile, anzi. Come ho detto in precedenza, sostituirò il collegamento con la versione di Web Archive. Grazie per averlo segnalato!
waldyrious

1
In realtà, gli esempi e le spiegazioni al link (finalmente funzionante) sono fantastici :)
penelope,

12

L'onda è un'onda monodimensionale; dipende solo da . L'onda è un'onda bidimensionale. Dipende ed . Come vedi, hai due frequenze, in entrambe le direzioni.f(t)=cos(ωt)tf(x,y)=cos(ωx+ψy)xy

Pertanto, la trasformata di Fourier (FFT) di ti darà , proprio come la FFT di ti dà . E se il tuo input è una funzione che somma i coseni 2D, allora la tua FFT 2D sarà la somma delle frequenze di quei coseni - di nuovo un analogo diretto della FFT 1D.cos(ωx+ψy)ω,ψcos(ωx)ω


10

Vale la pena notare che l'analisi di Fourier è un caso speciale di un concetto chiamato funzioni ortogonali . L'idea di base è di suddividere un segnale complicato in una sovrapposizione lineare di funzioni "base" più semplici. È possibile eseguire l'elaborazione o l'analisi sulle funzioni di base e quindi sommare i risultati per le funzioni di base per ottenere il risultato per il segnale originale.

Affinché ciò funzioni ci sono alcuni requisiti matematici per le funzioni di base, cioè formano idealmente una base ortonormale. Nel caso della trasformata di Fourier le funzioni di base sono esponenziali complessi. Tuttavia, ci sono molte altre funzioni che possono essere utilizzate anche per quello.


È vero. Quali altri tipi di funzioni di base ci sono? Sto pensando alle wavelet di daubechies, ma ce ne sono anche altre? Cosa li differenzierebbe?
Spacey

Probabilmente i più noti sono i polinomi; la rappresentazione di una funzione come un insieme di polinomi è conosciuta come la sua serie di Taylor . Questa serie è facilmente calcolabile dai derivati ​​della funzione.
MSalters

2
Un modo per trovare le funzioni di base è applicare l' analisi dei componenti principali . Le "immagini di autovetture" risultanti hanno spesso un aspetto più intuitivo rispetto alle funzioni sin / cos. Per un esempio, vedi Eigenfaces . Il dominio della frequenza è ancora rilevante per la percezione (i nostri occhi / cervello hanno rilevatori di bordi sensibili alla frequenza, in particolare quando è coinvolto il movimento); le funzioni di base non sono molto significative come immagini.
Dan Bryant,

PCA è una buona tecnica di calcolo di base ampiamente compresa, ma ce ne sono molti altri che fanno ipotesi diverse su come sono stati generati i dati; L'analisi indipendente dei componenti (ICA) è un esempio popolare. Un po 'più lontano, ci sono algoritmi per l'apprendimento di funzioni di base generiche usando la codifica sparsa (ad es. J Mairal et al., "Apprendimento di dizionari online per la codifica sparsa", ICML 2009), e poi gli approcci di "apprendimento delle caratteristiche" sviluppati dalle reti profonde gente.
lmjohns3,

1
Perché le funzioni devono essere ortogonali?
quantum231,

8

Nelle immagini l'aumento della frequenza è associato a transizioni più improvvise di luminosità o colore. Inoltre, il rumore è solitamente incorporato nella fascia alta dello spettro, quindi il filtro passa-basso può essere utilizzato per la riduzione del rumore.


1
quindi vuoi dire che le transizioni improvvise sono talvolta considerate rumore?
Abid Rahman K

1
Si Qualche volta. Esempi comuni includono il rumore delle zanzare (che risuona attorno ai bordi), il rumore dei blocchi JPEG ai bordi dei macroblocchi e, naturalmente, il grano. Considera un'immagine di un semplice gradiente. L'aggiunta di grana a questa immagine aumenta il suo contenuto ad alta frequenza introducendo piccole transizioni in tutta l'immagine.
Emre

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.