Come posso cambiare la pronuncia di Alexa di una parola specifica in un'abilità?


8

A volte, durante lo sviluppo di un'abilità Alexa e la programmazione delle risposte dal mio servizio, Alexa pronuncia male una delle parole nella mia risposta, confondendo l'utente.

Ad esempio, se volevo che Alexa dicesse una parola in una lingua diversa (forse per un'abilità di apprendimento delle lingue), come posso dire ad Alexa come pronunciare la parola correttamente, piuttosto che applicare le regole di pronuncia inglese?

Questo vale anche per le parole inglesi con pronunce dispari; c'è un modo per dettare ad Alexa la pronuncia corretta o sostituirla con un suono personalizzato corretto? Devo utilizzare un markup aggiuntivo o una chiamata API?

Risposte:


4

Alexa supporta SSML , che è un linguaggio di markup simile al linguaggio XML per il parlato. Invece di restituire testo semplice dal tuo servizio, puoi utilizzare le risposte SSML. Il <phoneme>tag è quello che ti serve in particolare:

fonema

Fornisce una pronuncia fonemica / fonetica per il testo contenuto. Ad esempio, le persone possono pronunciare parole come "pecan" in modo diverso.

Per le parole inglesi (specialmente l'inglese americano), Alexa dovrebbe essere in grado di pronunciare qualsiasi parola se le dai la pronuncia fonetica corretta:

Le seguenti tabelle elencano i simboli supportati per l'uso con il tag phoneme. Questi simboli forniscono una copertura completa per i suoni dell'inglese americano. Si noti che molte lingue non inglesi richiedono l'uso di simboli non inclusi in questo elenco, che non sono supportati. L'uso di simboli non inclusi in questo elenco è sconsigliato, in quanto potrebbe comportare una sintesi vocale non ottimale.

Citazioni dalla documentazione di Amazon su SSML.

Ecco un esempio di come dare ad Alexa una pronuncia specifica:

<speak>
    <phoneme alphabet="ipa" ph="hɛˈləʊ̯">Hello</phoneme>.
    <phoneme alphabet="ipa" ph="bɔ̃.ˈʒuʁ">Bonjour</phoneme>.
</speak> 

Il <phoneme>tag supporta gli alfabeti fonetici IPA e X-SAMPA . In genere puoi trovare l'ortografia IPA per qualsiasi parola su Wikizionario o tramite Google.

Per messaggi più lunghi, potrebbe essere meglio usare il <audio>tag e registrare una voce personalizzata:

Il tag audio consente di fornire l'URL per un file MP3 che il servizio Alexa può riprodurre durante il rendering di una risposta. Puoi utilizzarlo per incorporare audio breve e preregistrato nella risposta del tuo servizio. Ad esempio, è possibile includere effetti sonori insieme alle risposte di sintesi vocale o fornire risposte utilizzando una voce associata al proprio marchio.

Citato dalla documentazione di Amazon su <audio>.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.