Sto cercando di utilizzare una videocamera stereo per la ricostruzione della scena, ma di solito riesco a ottenere solo nuvole di punti sparse (cioè oltre la metà dell'immagine non ha informazioni sulla profondità adeguate).
Mi rendo conto che gli algoritmi di elaborazione stereo si basano sulla presenza di texture nelle immagini e hanno alcuni parametri che possono essere modificati per ottenere risultati migliori, come l'intervallo di disparità o la dimensione della finestra di correlazione. Per quanto riesco a mettere a punto questi parametri, non sono mai in grado di ottenere risultati che sono anche lontanamente vicini a ciò che si può ottenere usando un sensore attivo come Kinect.
Il motivo per cui lo voglio è perché molto spesso le nuvole di punti corrispondenti alle regioni adiacenti non hanno abbastanza sovrapposizioni per me per ottenere una corrispondenza, quindi la ricostruzione è gravemente compromessa.
La mia domanda agli esperti di Computer Vision è la seguente: cosa posso fare per ottenere nuvole di punti più dense in generale (senza modificare arbitrariamente l'ambiente del mio ufficio)?