Come eseguire l'output di sintesi vocale utilizzando la riga di comando?


Risposte:


125

In ordine di popolarità discendente :

  • say converte il testo in parlato udibile usando il motore vocale GNUstep.

    sudo apt-get install gnustep-gui-runtime
    say "hello"
    
  • festival Sistema generale di sintesi vocale multilingue.

    sudo apt-get install festival
    echo "hello" | festival --tts
    
  • spd-say invia una richiesta di output di sintesi vocale a speech-dispatcher

    sudo apt-get install speech-dispatcher
    spd-say "hello"
    
  • espeak è un sintetizzatore vocale software multilingue.

    sudo apt-get install espeak
    espeak "hello"
    

13
spd-saysembra essere preinstallato in 14.04 e versioni
release.ubuntu.com/trusty/…

3
Inoltre sudo pip install gTTS, (Sintesi vocale di Google / github.com/pndurette/gTTS ), gtts-cli "hello" -o hello.mp3puoi anche collegarlompg123 - . gtts-cli "why, hello there" | mpg123 -.
Elijah Lynn,

sfortunatamente, spd-saynon sembra essere in grado di giocare simultaneamente, solo uno alla volta
phil294

@ElijahLynn non funziona
Dims

espeak/ spd-sayè il migliore per i meme (gli altri non riescono nemmeno a pronunciare correttamente la parola "meme"). Il meglio che posso dire spd-sayusa espeakcome backend (le voci suonano allo stesso modo).
QwertyChouskie l'

18

espeak è un piccolo strumento carino.

Mi piace solo giocare con esso da una riga di comando. Potresti scoprire che è in conflitto con Pulseaudio, quindi sto usando una versione prolissa che nega di doverlo impostare correttamente.

sudo apt-get install espeak
espeak --stdout "this is a test" | paplay

espeak --help ti mostrerà le opzioni per calibrare la velocità di lettura, il tono, la voce, ecc.

Quando stai scrivendo i tuoi appunti, salvali come file di testo e poi:

echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"

Puoi quindi giocare con ffmeg et al per comprimerlo da PCM a qualcosa di più gestibile come MP3 o OGG. Ma questa è una storia diversa.


1
molto bello, si può anche provare l'interfaccia utente grafica per espeak, espeak-gui.
Sabacon,

14

Da man spd-say:

NOME
       spd-say - invia la richiesta di output di sintesi vocale al voice-dispatcher

SINOSSI
       spd-say [opzioni] "un po 'di testo"

DESCRIZIONE
       spd-say invia una richiesta di output di sintesi vocale al processo di sintesi vocale che lo gestisce e produce idealmente il risultato
       al sistema audio.

OPZIONI
       -r, --rate
              Imposta la frequenza del discorso (tra -100 e +100, impostazione predefinita: 0)

       -p, --pitch
              Imposta il tono del discorso (tra -100 e +100, impostazione predefinita: 0)

       -i, - volume
              Imposta il volume (intensità) del discorso (tra -100 e +100, impostazione predefinita: 0)

Quindi è possibile ottenere la sintesi vocale con il comando seguente:

spd-say "<type text>"

Ex:

spd-say "Welcome to Ubuntu Linux"

È inoltre possibile impostare la velocità del parlato, il tono, il volume, ecc. Vedere la pagina man.


3
spd-say -t female2 "text"lo rende sopportabile
scorpiodawg

6

Mbrola non funziona dall'11.10.

Gli strumenti SVOX (pico) sono facili da installare, da usare e offrono voci di buona qualità in Ubuntu. Installalo:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Ancora più semplice, è possibile utilizzare LibreOffice in combinazione con gli strumenti SVOX (pico) installando l' estensione "Leggi testo" e si ottiene una "GUI" per questo eccellente software TTS:

Imposta le opzioni di estensione del testo in lettura con Strumenti - Componenti aggiuntivi - Leggi selezione .... Usa / usr / bin / python come programma esterno. Selezionare un'opzione della riga di comando che include il token (PICO_READ_TEXT_PY).


4

Python Google Speach:

pip install google_speech

google_speech "Test the hello world"

Svox da Android:

apt-get install svox-pico

pico2wave --wave=test.wav "Test the hello world"
play test.wav

Svox Nanotts:

git clone https://github.com/gmn/nanotts.git
cd nanotts
make

./nanotts -v en-US "Test the hello world"

Collegamenti - Wiki:

Confronto di sintetizzatori vocali


1
Per installare e utilizzare google_speechsu ubuntu 18.04 ho dovuto installare python3-pipe libsox-fmt-mp3ed utilizzare pip3 install google_speech.
artm

3

E ancora un altro gui espeak: gespeaker. Utilizza entrambi espeake mbrolamotori. Inoltre, ha più opzioni di espeak-gui.


3

Quella che segue non è una soluzione FLOSS, ma potresti trovarla utile. (è una soluzione vinicola ),

Personalmente sono molto appassionato di TTS, lo uso abbastanza spesso ... ad es. ascoltando un discorso sconclusionato a cui non mi sarei mai preoccupato di attenermi all'alternanza (perché ho bisogno di prendere un'altra tazza di caffè ... :)

Alcune cose che ho scoperto lungo la strada .. o dovrei dire cose che non ho scoperto lungo la strada ... Per dirla senza mezzi termini: ogni pezzo di software vocale FOSS TTS che ho provato è alla pari e quindi inadatto per qualsiasi ascolto semi-prolungato ...

Attualmente uso NaturalVoices di ATnT. È disponibile solo per Windows (forse il Mac), ma funziona winein Ubuntu .. (ha un glifo minore, dove a volte ho bisogno di fare clic sul pannello quando mi allontano dal lettore ... È un minore problema rispetto al vantaggio ottenuto dalla qualità della parola da NatualVoices.

Alcune altre cose che ho scoperto essere praticamente essenziali per un'esperienza di ascolto insensata, sono; ...

  1. Questi programmi TTS non sono intelligenti (forse forse intelligenti come un giovane babbuino) .. quindi hanno bisogno di tutto l'aiuto che possono ottenere. e v'è una (e una sola Reader programma che ho trovato che aiuta molto in questo .. L'applicazione si chiama ReadPlease (2003 Pro)... E allowd di modificare appositamente parole e gruppi di parola venga pronunciata come si li vuole ... E ' non è assolutamente perfetto, ma per me ha fatto la differenza tra l'intero processo essendo utilizzabile e non utilizzabile ...

  2. Il discorso in Natural Voices è "ok", ma è un po 'noioso. Ci sono anche altri buoni prodotti, ma sfortunatamente sono tutti per Windows).
    A volte riesce a sorprendere molto bene .. ma OMG, inizialmente è un dolore! .. quindi # 2 è * pazienza ... e molti aggiornamenti della tua lista di "parole speciali" ... Per pazienza, intendo dire che tu (io) in realtà ti sei abituato ai particolari schemi del mio babbuino:) ... e da A proposito, al momento ho circa 3000 parole che ora suonano abbastanza "Umane" da non sentirmi più rabbrividire quando le sento.

    3. "Segui la palla che rimbalza" ... Ancora perché la voce non è mai buona come un vero oratore, a volte le cose devono essere chiarite ... Il programma Reader che uso ha una funzionalità per la quale ho persino messo a punto con la sua interfaccia dall'aspetto goffo .... Ha un'opzione di parola "seleziona la lettura attualmente in corso". Molti lettori hanno questo, ma ReadPlease mantiene attiva la linea corrente centro dello schermo .. Questo ha un valore inestimabile per poter vedere avanti e indietro per rileggere rapidamente ciò che hai appena perso (quindi il centraggio automatico della linea di curvatura è buono) ...

Beh, questa è la mia esperienza .. Ora vado a fare un caffè, e mentre lo faccio, ascolterò questo, per vedere come "legge" .... TTS è sorprendentemente buono per prendere errori di battitura (faccio molti errori di battitura) ...

Se qualcosa di buono come ATnT NaturalVoices si presenta sul repository Ubuntu, salterò su di esso.

Ecco un link ad alcuni esempi di voci naturali : io uso "MIke"


3

SVOX pico2wave

questo è quello che uso. E sembra naturale, è facile da capire, riconosce le Unità (m, ° C, kg, ...)

Ecco il mio primo post su pico2wave

Sintesi vocale naturale?

Tutto quello che devi fare è:

Vai su Ubuntu Software Center e cerca "pico". Troverai 4 o 5 voci con "Ling di ingombro ridotto ...". Installali.

Un possibile uso di pico2wave è descritto nel mio primo post (segui il link sopra).

Ciao


ho usato la tua strada, puoi dirmi come ottenere una voce femminile dolce e naturale usando la tua strada
user49557

3

Per festival(la voce mi sembra più naturale):

sudo apt-get install festival

echo "hello" | festival --tts

Configurazione del passo e della velocità:

creare ~/.festivalrc:

(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100") (Parameter.set 'Audio_Method 'Audio_Command)

Vedi anche http://www.solomonson.com/content/ubuntu-linux-text-speech

Aggiornamento: provato su un altro computer Ubuntu. Ho dovuto installare il pacchetto del motore vocale inglese per funzionare correttamente con festival:

sudo apt-get install festvox-kallpc16k

Inoltre playè un comando cli che viene fornito con il soxpacchetto:

sudo apt-get install sox


2

Anche se hai già accettato una risposta, volevo menzionarlo festival, che mi piace parecchio. Questo post sui forum di Ubuntu contiene molte informazioni su come creare voci molto belle.


2

Meet espeak-ng- Un sintetizzatore vocale software multilingue:

espeak-ng "text to read"
espeak-ng -f "~/file to read"

Utilizza una voce inglese predefinita, ma ci sono numerose altre voci per altre lingue e persino dialetti disponibili e possono essere elencate con espeak-ng --voices(per tutti) o ad esempio espeak-ng --voices=en(per inglese). Possono essere impostati -vinsieme con l'abbreviazione della lingua o il nome del file, ad esempio per scozzese o swahili:

espeak-ng -v en-gb-scotland "text to read" # language name
espeak-ng -v bnt/sw "text to read" # file name: “bnt” for Bantu, “sw” for Swahili

Ci sono molte altre opzioni disponibili, ad esempio -sper la velocità e -wper scrivere l'output in un file wave, vedere la manpage collegata di seguito.

Ulteriori letture

espeak-ng("Ng" per "next generation") è un fork sviluppato attivamente del espeaksoftware di sintesi vocale originale , vedere il capitolo Storia su Wikipedia . Entrambi sono disponibili dalle fonti ufficiali tramite il pacchetto espeako espeak-ngrispettivamente.



0

Lo strumento gTTS è ottimo per generare file audio dal testo. Utilizza l'API di sintesi vocale di Google Translate e genera file mp3.
Dato che lo usa pipper l'installazione, ti consiglio caldamente di installare Miniconda e quindi di utilizzarlo condaper creare un ambiente in cui è possibile installare gTTS. Puoi scaricare Miniconda da qui:

https://docs.conda.io/en/latest/miniconda.html

Il repository GitHub per gTTS è:

https://github.com/pndurette/gTTS

E puoi trovare la documentazione di gTTS qui:

https://gtts.readthedocs.io/en/latest/

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.