semplice riconoscimento vocale in linux


15

Qualcuno ha un semplice tutorial per eseguire il riconoscimento vocale sotto Linux? Vedo che pocketphinx è disponibile come download binario nel centro software, ma eseguendolo dal terminale non viene segnalato che ha bisogno di parametri, ma non so cosa mettere lì. Ho provato a installare tutti i modelli vocali elencati, ma non so dove vengano salvati o come farli funzionare. Inoltre non ero sicuro di cosa fare per far funzionare Sphinx3. Le manpage di Sphinx3 sembrano rotte e quella di pocketphinx non ha un esempio di utilizzo che abbia senso per me.

Sto cercando qualcosa che ottenga il 60% di riconoscimento corretto dall'input del microfono con un vocabolario e parole limitati, e quindi posso scriverlo in un file di testo: questa roba esisteva alla fine degli anni '80. Quindi, so che esiste e dovrebbe funzionare in qualche modo.

Grazie.

(La connessione Internet PS è impossibile)


Ho avuto problemi a far funzionare simon-listens.org su Ubuntu l'ultima volta che ho provato, ma è stato un po 'di tempo fa, vale la pena indagare
david.libremone,

1
Potresti voler stabilire se richiedere una connessione Internet attiva è ok. Il servizio vocale di Google accetta un file audio e restituisce testo, ma non è in grado di essere offline.
RobotHumans,

Internet attivo è un non andare.
user2068060

1
Il modo migliore per aggiungere ulteriori informazioni alla tua domanda è modificarlo, con il pulsante Modifica . È meglio visibile in questo modo e i commenti sono principalmente per scopi secondari e temporanei. I commenti vengono rimossi in varie circostanze. Qualunque cosa importante per la tua domanda dovrebbe essere nella domanda stessa.
Guntbert,

Risposte:


4

Prova Simon Listens

Simon è un programma di riconoscimento vocale open source e sostituisce mouse e tastiera. È progettato per essere molto flessibile e consente la personalizzazione per qualsiasi applicazione in cui è necessario il riconoscimento vocale.

Per scaricare e maggiori informazioni visita simon su kde.org



0

Il tasso di accuratezza dipende da molteplici fattori come l'accento, i rumori di fondo, la qualità delle registrazioni. I modelli pre-addestrati sono un po 'limitati e hanno utilizzato Transcribear invece uno strumento di sintesi vocale basato su browser Web in Linux per i miei progetti di trascrizione.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.