Come seguito alla mia domanda precedente, mi chiedevo se esistessero librerie di rilevazione vocale. Per rilevamento vocale intendo passare un buffer audio e recuperare un indice di dove inizia e si interrompe il parlato. Quindi se avessi 10 secondi di campionamento audio a 44kHz, mi aspetterei una serie di numeri come:
44000
88000
123000
190334
...
Ciò indicherebbe ad esempio che il discorso inizia un secondo dopo e termina al secondo punto, ecc.
Quello che non sto cercando è il riconoscimento vocale che scrive il testo dalla parola parlata. Questo purtroppo è ciò che vedo molto quando google "rilevazione vocale".
Sarebbe bello se la libreria fosse in C, C ++ o anche Objective-C mentre sto scrivendo un'app per iPhone.
Grazie!