So che HOG è piuttosto all'avanguardia per il rilevamento di persone, ma nella sua forma originale HOG è solo un metodo di rilevamento, e non credo che sia particolarmente veloce (c'è una notevole velocità che prende la finestra scorrevole e rifiuta possibilità improbabili in anticipo, ma è stato brevettato).
Qual è l'attuale approccio allo stato dell'arte per determinare la posa di una persona (comprese le pose ravvicinate come un colpo alla testa e un colpo a mano, ecc ...) e per segmentare la persona dallo sfondo?
L'impostazione qui è immagini fisse.