Nella teoria dello spazio-scala la rappresentazione dello spazio-scala del segnale , (nel caso dell'immagine ) è data come: dove è un kernel gaussiano con parametro e è una convoluzione. Modificando il parametro riceviamo un'immagine più o meno levigata. Di conseguenza, la rappresentazione più grossolana (parametro ) non conterrà piccoli oggetti o rumore.d = 2 L ( x , y , t ) = g ( x , y , t ) * f ( x , y ) g ( x , y ; t ) t ∗ t t
Il punto principale è trovare un modo per rilevare le caratteristiche invarianti della scala, giusto? In modo che per alcune immagini di dimensioni ridotte, le funzioni come i punti chiave verranno rilevate correttamente, anche se le dimensioni sono diverse, senza trovare altri punti chiave rumore.
Nel documento stanno usando i derivati normalizzati. . Qual è il significato dell'utilizzo del derivato normalizzato, in che modo aiuta nell'invarianza di scala?δ ξ , γ - n o r m γ
Da questa immagine possiamo vedere che quasi nelle stesse posizioni sono stati trovati i diversi punti chiave (di dimensioni diverse). Come è possibile?
Se riesci a spiegare l'algoritmo passo-passo del rilevamento di funzionalità invarianti su scala, questo sarebbe fantastico. Cosa viene effettivamente fatto? I derivati possono essere presi da o . Il BLOB può essere rilevato prendendo la derivata di da variabili . In che modo il derivato di sta aiutando qui?t L ( x , y ) t
Il documento che stavo leggendo è: Rilevamento delle funzioni con selezione automatica della scala