Quindi, stavo leggendo l'articolo su SURF (Bay, Ess, Tuytelaars, Van Gool: Speeded-Up Robust Features (SURF) ) e non riesco a comprendere questo paragrafo qui sotto:
A causa dell'uso di filtri box e immagini integrali, non è necessario applicare iterativamente lo stesso filtro all'output di un layer precedentemente filtrato, ma è possibile applicare filtri box di qualsiasi dimensione esattamente alla stessa velocità direttamente sull'immagine originale e anche in parallelo (anche se quest'ultimo non è sfruttato qui). Pertanto, lo spazio della scala viene analizzato aumentando la dimensione del filtro anziché ridurlo in modo iterativo, figura 4.
This is figure 4 in question.
PS: il documento ha una spiegazione dell'immagine integrale, tuttavia l'intero contenuto del documento si basa sul particolare paragrafo sopra. Se qualcuno ha letto questo documento, puoi dire brevemente cosa sta succedendo qui. L'intera spiegazione matematica è piuttosto complessa per avere una buona comprensione, quindi ho bisogno di assistenza. Grazie.
Modifica, un paio di problemi:
1.
Ogni ottava è suddivisa in un numero costante di livelli di scala. A causa della natura discreta delle immagini integrali, la differenza di scala minima tra 2 scale successive dipende dalla lunghezza lo dei lobi positivi o negativi della derivata parziale del secondo ordine nella direzione di derivazione (x o y), che è impostata su un terzo della lunghezza della dimensione del filtro. Per il filtro 9x9, questa lunghezza lo è 3. Per due livelli successivi, dobbiamo aumentare questa dimensione di un minimo di 2 pixel (un pixel su ciascun lato) al fine di mantenere le dimensioni irregolari e quindi garantire la presenza del pixel centrale . Ciò comporta un aumento totale della dimensione della maschera di 6 pixel (vedere la figura 5).
Figure 5
Non riuscivo a dare un senso alle linee in un determinato contesto.
Per due livelli successivi, dobbiamo aumentare questa dimensione di almeno 2 pixel (un pixel su ciascun lato) per mantenere le dimensioni irregolari e garantire così la presenza del pixel centrale.
So che stanno cercando di fare qualcosa con la lunghezza dell'immagine, anche se stanno cercando di renderlo strano, in modo che ci sia un pixel centrale che consentirà loro di calcolare il massimo o il minimo del gradiente di pixel. Sono un po 'incerto sul suo significato contestuale.
2.
Per calcolare il descrittore viene utilizzato il wavelet di Haar.
In che modo la regione centrale ha un basso ma un alto.
3.
Qual è la necessità di avere un filtro approssimativo?
4. Non ho alcun problema con il modo in cui hanno scoperto la dimensione del filtro. Hanno "fatto" qualcosa empiricamente. Tuttavia, ho qualche fastidioso problema con questo pezzo di linea
L'output del filtro 9x9, introdotto nella sezione precedente, è considerato come il livello di scala iniziale, a cui faremo riferimento come scala s = 1.2 (derivati gaussiani approssimativi con σ = 1.2).
Come hanno scoperto il valore di σ. Inoltre, come viene mostrato il calcolo del ridimensionamento mostrato nell'immagine qui sotto. La ragione per cui sto affermando su questa immagine è che il valore di s=1.2
continua a ripetersi, senza indicare chiaramente la sua origine.
5.
La matrice hessiana rappresentata in termini di L
quale è la convoluzione del gradiente del secondo ordine del filtro gausssiano e dell'immagine.
Tuttavia si dice che il determinante "approssimato" contenga solo termini che coinvolgono il filtro gaussiano del secondo ordine.
Il valore di w
è:
La mia domanda sul perché il determinante è calcolato come quello sopra, e qual è la relazione tra la matrice approssimativa dell'Assia e quella dell'Assia.