Ho esaminato gli algoritmi di rilevamento dei marker da utilizzare con un'applicazione basata su Kinect e la maggior parte del lavoro che sono riuscito a trovare si concentra ovviamente sul rilevamento delle caratteristiche nelle immagini "normali".
Tuttavia, l'hardware Kinect fornisce (essenzialmente, una volta regolato) un valore di profondità di 11 bit per pixel.
Questa immagine di profondità contiene anche vari artefatti visivi dalle ombre proiettate attorno ai bordi degli oggetti (vedi ad esempio il forte bordo nero in questo video http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).
Mentre alcune tecniche tradizionali di visione artificiale (ad es. Rilevamento dei bordi) funzionano bene con questo, altre no, e sembra che ci siano poche informazioni in rete che ne discutono.
Come semplice esempio, l'uso del valore di profondità rende banale il rilevamento dell'orientamento di un blocco marker una volta individuato.
Quindi, qualcuno ha visto discussioni / documenti / ecc. Che coprono l'elaborazione di un'immagine di profondità per il rilevamento di funzionalità?
Qualcuno può raccomandare un buon algoritmo per il rilevamento di marcatori "di profondità" (efficacemente blocchi origami invece di marcatori b / n stampati)?
Quello che ho fatto finora è stata la sperimentazione ad hoc usando opencv per elaborare le immagini, ma non è abbastanza stabile o veloce.
Se si collega a un prodotto commerciale di visione artificiale senza alcun tipo di prova, si prega di indicare nella risposta il motivo per cui si ritiene che sia appropriato.