Progetto di sintesi vocale per un genitore cieco


12

Il mio primo post qui. (Spero sinceramente che rientri nell'ambito dei post consentiti che non sapevo dove altro girare).

Ho in programma di fare un progetto per una madre di novant'anni che sta rapidamente perdendo la vista e conduce una vita relativamente spensierata.

Si siede da sola a casa a guardare il cavo di base e non ha una connessione Internet. Ha un enorme telecomando con 60 piccoli pulsanti ed è fondamentalmente confuso da tutto.

Voglio solo mettere su un disco rigido una libreria di film e / o audiolibri in modo che possa navigare attraverso di loro e guardare a suo piacimento.

Ho deciso che ha bisogno di un semplice joystick con 6 grandi pulsanti configurabili. Avrei bisogno di scoprire in qualche modo che i titoli potrebbero essere letti automaticamente da lei (mentre scorre verso il basso prima della selezione).

Una GUI che fornisce un testo ENORME sul monitor potrebbe essere sufficiente ... ma credo che la funzionalità di sintesi vocale possa essere il problema più difficile.

Se i titoli le vengono letti, una GUI è quasi un punto controverso.

XBMC, vedo, ha alcune funzionalità di sintesi vocale ... anche se non riesco a determinare se sarebbe qualcosa che richiederebbe alla sua vista di navigare attraverso l'interfaccia per "arrivare" al contenuto. (Inoltre, non riesco a determinare se il menu stesso viene letto dalla GUI, consentendo la navigazione "senza vista")

Ho bisogno di una GUI da aprire con un elenco immediatamente all'avvio (attraverso il quale può semplicemente scorrere e selezionare il contenuto).

La mia semplice domanda è se sia possibile con l'IP e se sembra che questo sia un obiettivo raggiungibile.

Nel caso in cui qualcuno potesse indicarmi la giusta direzione, lo apprezzerei senza fine.

Grazie molto.


Hai provato a cercare "discorsi" su questo forum. Ci sono alcuni link (in realtà non ne ho provato nessuno) ad esempio raspberrypi.stackexchange.com/questions/1015/…
Milliways

Non sono sicuro che tu l'abbia pubblicato sui forum dell'organizzazione Rapsberry . Se non lo hai fatto, è il tipo di domanda che viene posta lì abbastanza spesso.
Giovanna,

Sebbene esista un tag per "riconoscimento vocale", non vi è stato il contrario per "generazione del parlato", che è un argomento discreto in sé. Fa parte di ciò che viene spesso definito "sintesi vocale" (la seconda parte) e tutti questi sono spesso associati a questioni che vengono generalmente definite "accessibilità" che si riferiscono al rendere le cose più facili da usare per entrambi umani pienamente capaci e anche coloro che hanno un certo grado di compromissione che potrebbe richiedere funzionalità aggiuntive per ottenere gli stessi risultati. Questa risposta è stata utilizzata per creare questi tre tag.
SlySven il

3
Adoro l'idea di questo progetto così tanto, l'ho appena nominata per la migliore idea di progetto Raspberry Pi originale nel concorso natalizio Give-away su Raspberry Pi Meta.
Phil B.

1
A tutti coloro che hanno pubblicato: sono molto commosso e incoraggiato dalla risposta a questo. Sono un neofita e non ho mai visto un PI con i miei occhi. Sono molto grato per le gentili risposte e ho rinnovato la mia determinazione a perseguire questo grazie a loro. Ho anche condiviso le notizie con mia madre, che dice che preferisce la torta di mele e quella di lamponi e non sa davvero di cosa sto parlando ... ma per ora va bene così :).
LeoFib,

Risposte:


8

Non sono sicuro di come realizzare la GUI, ma so come fare text-to-speech. Puoi usare espeak:

sudo apt-get install espeak
espeak 'Hello world'

Per impostazione predefinita, la voce di espeak è difficile da capire (per me). Per trovare una voce, utilizzare:

sudo apt-cache search espeak

Quindi, trova una voce. Installalo. Quindi, corri

man espeak

per scoprire come cambiare la voce. Dovrebbe essere semplice

Ecco un esempio di qualcosa che ho fatto usando espeak: https://github.com/Merlin04/robotthingy

Modifica: penso che potresti creare una GUI con Kivy. Usa Python.


7

Ho solo un'esperienza limitata con XBMC ma credo fermamente che ciò potrebbe già essere troppo complicato per "il pubblico di riferimento" (questa donna di 90 anni).

Tuttavia, credo che questo progetto sia certamente realizzabile su un RasPi. Dato che sono un sviluppatore web, suggerirei di creare una semplice webapp. Non ho idea di nulla se esista qualcosa del genere, ma non riesco a immaginare che sia troppo difficile da sviluppare.

Idea base:

  1. RasPi con Raspbian.
  2. Webapp che esegue apache.
  3. Alcuni backend (ad esempio PHP) indicizzano i file sul disco rigido, formattano il nome in un formato leggibile e li generano in un elenco.
  4. Usa JavaScript per controllare l'ingresso del joystick e fai leggere i titoli di film / libri con l'API di sintesi vocale HTML5 (esempio: http://creative-punch.net/2014/10/intro-html5-speech-synthesis-api / ).
  5. Alla selezione di un film / libro, è sufficiente aprire il file nel browser. (In questo modo non dovrai aprire una nuova finestra in modo che possa semplicemente tornare al menu premendo il pulsante Indietro.)

OSMC (kodi) espone alcune API di riposo. Forse potresti usarlo per costruire il tuo front-end / gui. Tuttavia, sono d'accordo con Rien sul fatto che questo sembra troppo complesso per il tuo pubblico. Suppongo che un essere umano potrebbe essere vicino ad aiutare con l'avvio / arresto di audiolibri per lei?
Havnar,

Ciao Havnar, No, in realtà. Ha due cani in casa e questo è tutto ... Una cosa che ho trascurato di menzionare, credo, è che non ha nemmeno una connessione Internet.
LeoFib,

Va bene qualche domanda. Li terrò a corto per brevità. 1) RasPi 2 per questo, giusto? 2) Quale sistema operativo consiglieresti per questo? 3) Pensi che questo sarebbe fattibile senza WIFI? - Non ha una connessione di rete, ahimè. 4) Apache viene utilizzato per eseguire un server o è un sistema operativo? 5) Dovrei iniziare a familiarizzare con Linux e i suoi comandi per prepararmi? Ecco un'idea: youtube.com/watch?v=NCVWX4suGE4 Cosa ne pensi? Dovrei semplicemente andare con un kit RPI 2 generico? - Molte grazie e buon anno.
LeoFib,

1
1) il pi2 è molto più potente, questo ti gioverà in entrambi i modi. 2) raspbian è il più intuitivo e il più utilizzato, quindi è facile trovare guide e aiuto su 3) puoi avere il wifi senza una connessione internet, non è necessaria la configurazione wireless se vai con un telecomando a infrarossi 4) puoi usare molti server Web Apache sono ampiamente utilizzati 5) sì, uno strumento utile comunque! 5B) puoi iniziare con un pi2 con sdcard, cavo hdmi, alimentatore e iniziare a giocare con esso. Alcune abilità di sviluppo di applicazioni possono ovviamente essere utili.
Havnar,

1
Ho una visione delle cose diversa da quella di Havnar, suppongo, quindi le mie risposte qui: 1) Non necessario, 1B dovrebbe essere abbastanza potente anche io penso, ma 2 è comunque sicuro 2) Raspbian in effetti, il più noto quindi la maggior parte supporta 3/4 ) Apache è un software server web, quindi è possibile eseguire i propri siti Web su un sistema (raspi in questo caso). Ciò significa che non è necessario alcun collegamento Internet poiché la pagina Web verrà eseguita sul tuo RasPi. 5) Sì, credo che alcune linee di comando di base siano utili per far funzionare raspbian e apache.
Rien Heuver,

4

Ho scavato un po 'di luce per te poiché la maggior parte delle cose può diventare troppo complessa abbastanza rapidamente per il tuo pubblico di destinazione.

Dalla mia esperienza personale, i pulsanti e la gui di (non importa quanto semplice nei tuoi dev occhi) può venire attraverso come di confusione per gli anziani.

Non so quanto siano buone le tue abilità con lo sviluppo (web), o se puoi ottenere uno sviluppatore esperto motivato per aiutarti a raggiungere i tuoi obiettivi, ma la semplicità per l'utente finale è la chiave qui.

Pertanto "The One Button Audiobook Player" potrebbe essere quello che stai cercando. O forse un adattamento ad esso.

estratto sotto:

It basically consists of:

1 Raspberry Pi
1 ModMyPi enclosure
1 button
2 resistors (330 Ohm, 10 Kilo-Ohm)
1 blue LED
1 (slow) 8GB SD-Card
some wire
a pair of speakers

È stato utilizzato il seguente software:

Raspbian minimal image (http://www.linuxsystems.it/2012/06/raspbian-wheezy-armhf-raspberry-pi-minimal-image)
mpd (music player daemon)
mpc
mpd-python
pyudev (for USB access)
a self-written python script

Le caratteristiche sono le seguenti:

  • sempre acceso: quando accendi il lampone, questo si avvierà e avvierà lo script Python con l'audiolibro in pausa

  • utilizzo di un pulsante: il pulsante mette in pausa e annulla l'audiolibro o torna indietro di una traccia quando si preme il pulsante per più di 4 secondi

  • ricorda la posizione: ricorderà sempre l'ultima posizione giocata

  • un solo audiolibro: sul Raspberry ci sarà sempre un solo audiolibro

  • facile distribuzione dell'audiolibro: quando si collega una chiavetta USB con un nome / un'etichetta speciale, Raspberry smette di riprodurre, monta la chiavetta USB, cancella il vecchio audiolibro, copia quello nuovo, ricostruisce la playlist e - dopo aver scollegato il chiavetta USB: avvia il nuovo audiolibro in modalità pausa

  • multiformato: poiché utilizza mpd, il lettore supporta Ogg Vorbis, FLAC, OggFLAC, MP2, MP3, MP4 / AAC, MOD, Musepack e wave

>>> fonte <<< --- tutto il merito va lì!

collegamento github


Usando un Joystick si potrebbe essere in grado di espandere l'interfaccia di controllo se fatto con cura per presentare un'interfaccia utente coerente e semplice per il pubblico di destinazione - un commentatore sul sito collegato ha notato che ricordava solo la posizione di gioco mentre l'RPI era alimentato - potrebbe essere qualcosa da rivedere - anche se sono sicuro che quando ho fatto qualche esperimento con un server musicale LAN mi sono mpdricordato dove si trovava in una lunga playlist, forse c'è un'opzione per questo ...
SlySven

Non c'è motivo di non lasciare un pi alimentato, è comunque meglio per la scheda SD Pi, non è costruito per essere chiuso.
Havnar,

" ... non è costruito per essere chiuso. " Forse è meglio dire "non è tollerante che venga rimosso il potere senza essere correttamente spento." - Un UPS per un Pi che ho ha la possibilità di avviare e spegnere il Pi su un ciclo del timer di qualsiasi cosa tra 2-1000 minuti ON e 2-1000 minuti OFF - che avrebbe applicazioni nella fotografia time-lapse - e lì non ci sono indicazioni che ciò sia intrinsecamente dannoso, anche se concordo sul fatto che la scheda SD potrebbe "logorarsi" un po 'più velocemente dalle scritture dei file di registro extra.
SlySven,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.