Buona soluzione di sintesi vocale per Windows [chiuso]


9

Sto eseguendo Windows 7 e so che ha la capacità di leggermi il testo nelle mie applicazioni, ma sto cercando una buona utility per salvare blocchi di testo come file wav o mp3. Potrebbe già essere integrato nel sistema operativo, ma abilmente mascherato. So di poter scrivere un programma per chiamare l'API, che è il mio prossimo passo se non esiste già una buona soluzione.

Mi piace molto la qualità del sistema AT&T , ma ha alcune restrizioni piuttosto marcate sull'uso dell'MP3 prodotto. Mi piacerebbe usarli nel mio podcast.

Anche il Web è OK, purché produca facilmente un file Wav, MP3 o qualche altro file audio standard senza limiti (di dominio pubblico o Creative Commons). Naturalmente preferisco il libero o open source rispetto a quello commerciale, ma questo non è un requisito.

Risposte:


4

Ho provato espeak , festival e MaryTTS . Generano tutte voci comprensibili per la maggior parte, ma non sono molto naturali. Anche con download vocali aggiuntivi per questi sistemi (ad esempio Mbrola, CMU Arctic) le voci non sono così grandi.

Le voci di IVONA sono le migliori che abbia mai sentito finora. Ti danno una demo gratuita di 30 giorni che è sufficiente se hai un compito unico da fare. Dopo di che sono come $ 45 / voce. Amazon ha appena acquistato la società in modo da sapere che è solida ( http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/ ).

Funzionano con l'interfaccia SAPI di Microsoft, il che significa che le voci sono disponibili per qualsiasi programma che lo supporti (ad es. Adobe Reader). Li sto usando con il programma Text To Wav , che è bello per la conversione di file di testo in file wave.

modificare

In realtà rileggi la tua domanda e penso che per uso non personale (ad esempio podcast) il prezzo è probabilmente molto più alto per IVONA. In tal caso, direi di dare un'occhiata a MaryTTS.


Ho appena ascoltato MaryTTS e fa esplodere il discorso di espeak e festival.
trentatré

MaryTTS ha grandi voci ed è anche gratuito.
Jim McKeeth,

Sembra che il text-to-speech per le voci Ivona per l'uso desktop sia ora fornito da TextAloud
Utente

6

eSpeak è gratuito e open source e offre tutto il necessario.

Può essere eseguito come programma da riga di comando per pronunciare testo da un file o da stdin.
È inoltre disponibile una versione della libreria condivisa.

* Include voci diverse, le cui caratteristiche possono essere modificate.
* Può produrre output vocale come file WAV.
* SSML (Speech Synthesis Markup Language) è supportato (non completo),
  e anche HTML.
* Dimensioni compatte. Il programma e i suoi dati, comprese molte lingue,
  ammonta a circa 1 Mbyte.
* Può tradurre il testo in codici fonemi, in modo che possa essere adattato come fronte
  fine per un altro motore di sintesi vocale.
* Potenziale per altre lingue. Diversi sono inclusi in varie fasi
  di progresso. È l'aiuto di madrelingua per queste o altre lingue
  accolto.
* Strumenti di sviluppo disponibili per la produzione e l'ottimizzazione dei dati dei fonemi.
* Scritto in C ++.

Mentre eSpeak sembra interessante, potrebbe davvero beneficiare di una guida "quick start". Grazie per la punta però. Continuerò a lavorarci.
Jim McKeeth,

+1 per eSpeak. Sto cercando un'app per farlo da molto tempo. Grazie Signore!
Axxmasterr,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.