Controllo vocale sull'ambiente desktop


16

Vorrei abilitare un sistema in grado di rispondere ai comandi vocali dell'utente ed eseguire script secondo il comando verbale GIVEN.

Idealmente, vorrei che il computer ascoltasse costantemente.

Una volta udita la parola "Computer", si attiverà e ascolterà i comandi per circa 10 secondi.

Una volta attivo, e mentre è in ascolto, vorrei che un altro set di parole d'ordine fosse in grado di eseguire script.

Per esempio....

(Il computer è inattivo) "Computer" (il computer ascolta immediatamente) "Accedi a nuovi MESSAGGI" (I MESSAGGI sono parole d'ordine * IGNORA "ACCESSO NUOVO" - il computer esegue uno script e apre l'evoluzione o l'empatia). Ce ne potrebbe essere uno per il browser, uno per chiudere le finestre e mostrare il desktop, o un sacco di cose davvero.

È anche possibile?

Risposte:


7

Gnome-Voice-Control

Sviluppata come parte di Google Summer of Code 2007, questa è stata un'idea per sviluppare alcune funzionalità che miglioreranno l'usabilità in Gnome Desktop.

L'obiettivo è implementare un sistema di controllo vocale desktop. Il sistema consiste in un'applicazione che monitorerà l'ingresso audio (microfono) e quando viene rilevato un segnale audio significativo, il software cattura, elabora e riconosce il segnale e quindi esegue l'azione desiderata su Gnome Desktop. In una serie di azioni potrebbe includere massimizzare, minimizzare, chiudere la finestra attiva; aprire un programma specifico; passare da un desktop all'altro; tra gli altri. GnomeVoiceControl è implementato in C insieme a CMU Sphinx, che è uno strumento open source, creato per convertire il parlato in testo.

Presentazione degli autori

Sfortunatamente sembra che non si sia sviluppato molto oltre gli "obiettivi" di base - tuttavia sembra esserci qualche attività che aggiunge supporto per nuove lingue come il bulgaro e il turco quest'anno.

Installare:

sudo apt-get install gnome-voice-control

Ornitorinco

C'è un progetto dall'aspetto interessante chiamato platypus - fondamentalmente è un front-end Linux per Dragon Naturally Speaking che gira su Wine.

La richiesta di fama per questa applicazione è "può persino avviare programmi e script Windows o Linux, ad esempio" start terminal ".

VEDICS

Questo è un progetto nuovo che dice che funziona con l'interfaccia Unity.

La pagina del progetto dice che riconosce "run [nome programma]" - quindi in teoria tu [nome programma] potresti essere qualsiasi script tu voglia eseguire.


Grazie per la risposta eccezionalmente veloce. Ho sentito parlare di quel programma e l'ho installato, ma non sembra aver superato la configurazione - dice solo "config". Sono sorpreso che non sia stato fatto molto lavoro su questo fronte. C'è forse un Windows equivalente che potrei correre con il vino?
BorgDomination

1
la versione precedente della voce di gnomo in sinaptica mi ha dato gli stessi risultati. Ho provato le ultime dal sito Web e sembrava andare oltre ma non l'ho mai fatto funzionare correttamente. le dipendenze manuali erano dolorose.
Kendrick,

3

Simon ascolta

Questo è un progetto open source volto a sostituire il mouse e / o la tastiera con il riconoscimento vocale inizialmente sviluppato per le persone con disabilità fisiche.

C'è un ppa da cui possiamo installare l'applicazione: ppa: grasch-simon-listens / simon


simon funziona solo con kde? Sembra davvero fantastico e l'ho installato ma non riesco a farlo funzionare con gnome-shell. specialmente la gestione delle finestre. Se voglio mostrare tutte le finestre per esempio, funzionerà in modo diverso in kde env e gnome env giusto?
Joshua Robison,

1
Le dipendenze dovrebbero essere risolte durante l'installazione su Ubuntu <= 12.04 dal ppa ma non ho provato di recente, e non ho idea di come possa interferire con la shell GNOME. Non esiste una versione (ancora) per 12.10.
Takkat,

3

Google2Ubuntu

Google2Ubuntu è uno strumento che ti consente di controllare il tuo computer utilizzando i comandi vocali tramite l'API di riconoscimento vocale di Google.

Eseguire i comandi seguenti sul terminale per installare google2Ubuntu,

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

fonte


1

Riconoscimento vocale Linux

È stato sviluppato per funzionare con distribuzioni Linux, è molto configurabile e facile da estendere, supporta dizionari personalizzati, riconoscimento basato sul contesto, modalità di dettatura e macro configurabili.

Per installare Linux Speech Recognition vai alla pagina GitHub del progetto . Scarica il file ZIP ed estrailo.

Quindi installare alcune dipendenze:

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

Apri la cartella estratta (Palaver-master) nel terminale ed esegui l'installazione:

cd /~Path-to-folder~/Palaver-master/
./setup

Ora è solo per assegnare un tasto di scelta rapida per abilitare la registrazione, per farlo vai su Impostazioni di sistema ...> Tastiera> Scorciatoie> Scorciatoie personalizzate fai clic sul pulsante Più per aggiungere una scorciatoia, chiamala Riconoscimento vocale e imposta il comando su:

/~Path-to-folder~/Palaver-master/hotkey

Fare clic su Applica, fare clic sul collegamento e quindi assegnare un tasto di scelta rapida per attivare il riconoscimento vocale.

Nota che non è stata ancora rilasciata una build stabile, quindi non aspettarti che i comandi siano pienamente funzionali in questa fase, molte frasi verranno riconosciute, ma non verrà eseguita alcuna azione reale.



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.