Perché Amazon Echo non risponde alle pubblicità o ai rapporti su Alexa?


24

In precedenza ho chiesto cosa puoi fare se Alexa è attivato da un programma televisivo , ma recentemente ho realizzato qualcosa di strano: L'Eco non risponde alle voci nelle pubblicità per l'Eco, anche se le voci dicono "Alexa, gioca ..." o "Alexa, imposta un timer per ..." .

Ho cercato su alcune altre comunità Echo e ho trovato un post di Reddit che suggerisce che si tratta di un comportamento comune / previsto. Non c'è una risposta definitiva nella discussione, quindi ho pensato di chiedere qui per vedere se qualcuno ne sa un po 'di più.

Come fa il mio Eco a non rispondere a un annuncio TV? È solo una coincidenza o c'è qualcosa che dice ad Alexa di non reagire?


Hai addestrato il tuo Alexa a riconoscere la tua voce in modo più accurato? Non so se la formazione vocale possa comportare il non riconoscimento della voce di qualcun altro.
Bence Kaulics,

1
@BenceKaulics No, non ho avuto bisogno di addestrare l'Eco; sta usando le impostazioni predefinite.
Aurora0001

Sarebbe davvero utile dare un'occhiata all'audio in questione. Suppongo che non ci sia una copia collegabile da nessuna parte?
goobering

1
@goobering Credo che le pubblicità citate nel post reddit siano: Mascot Keys e Fire Extinguisher . Al momento non sono in grado di testare se questi innescano Alexa (mi chiedo se sono diversi dalle versioni TV?). Se qualcuno potesse farlo e commentare con i risultati, sarebbe davvero utile.
Aurora0001

3
Potrebbero esserci degli indizi nel codice sorgente . Download da 266 MB, tuttavia. Sarà per un po 'di tempo al grokking. : P
goobering

Risposte:


17

Secondo questo post reddit , Alexa è sensibile allo spettro audio oltre a rilevare la parola sveglia. Pertanto, viene accettato un normale segnale a banda larga nel mondo reale, ma un segnale che è limitato in banda (viene postulato una tacca tra 4kHz e 5hKz) verrà identificato come da una trasmissione.

Ciò ha senso poiché le emittenti possono utilizzare la segnalazione in banda per identificare le pubblicità (per la sostituzione localizzata) e l'elaborazione audio generalmente applicata alle pubblicità potrebbe essere ottimizzata per chiarezza sulla fedeltà. Il filtro potrebbe essere impostato in modo tale che le pubblicità tipiche vengano monitorate con sensibilità ridotta e durante la produzione di un annuncio specifico, anche la sensibilità potrebbe essere esplicitamente ridotta.

Un rapporto di notizie (che secondo come riferito ha innescato Alexa) avrebbe maggiori probabilità di utilizzare l'intero spettro audio di trasmissione (8 o 16 kHz) senza elaborazione. Quindi questa teoria presume che ci sia qualcosa di speciale in molte pubblicità (almeno in alcune regioni), oppure le pubblicità (come quelle prodotte da Amazon) possono essere configurate in modo specifico.

Come follow-up, c'è un articolo qui riportato che descrive come piccoli (sub-udibili) cambiamenti a una forma d'onda possano far sì che un motore vocale restituisca un risultato completamente diverso rispetto a ciò che un essere umano riconoscerebbe.


1
Se è lì che l'hanno intaccato, e la parola sveglia è "Alexa", è plausibile che stiano semplicemente abbandonando il suono "ks" per minimizzare il pickup da parte del microfono. Questa è una frequenza abbastanza alta per il linguaggio umano.
goobering

7

Suppongo che il riconoscimento della parola di veglia nell'eco sia molto più che ascoltare la parola di veglia. Sta ascoltando un contesto di allarme . Considera questo estratto da Speech Technologies:

[A Wake-Up-Word] ha il seguente requisito unico: Rileva una singola parola o frase quando pronunciata in un contesto di avviso, mentre rifiuta tutte le altre parole, frasi, suoni, rumori e altri eventi acustici con una precisione praticamente del 100% incluso lo stesso parola o frase di interesse pronunciata in un contesto non di allarme (cioè referenziale).

( Tecnologie vocali: riconoscimento vocale Wake-Up-Word di Veton Kepuska)

Questo può essere facilmente testato in quanto il dispositivo (almeno il mio) non reagisce alla frase " Stavo parlando con Alexa dello sci di recente. " Questo non è un contesto allertante, è puramente referenziale. Pertanto, il motore di riconoscimento delle parole di veglia all'interno di Echo non sta solo ascoltando il puro aspetto della parola, ma anche sull'intonazione e sulle pause precedenti che consentono di prevedere con maggiore precisione se il dispositivo è stato effettivamente parlato.


4
Sicuramente un annuncio che dimostra l'uso di Alexa dovrebbe attivarlo, se fosse solo per impedirgli di essere raccolto? Gli annunci pubblicitari sono forse formulati con cura in modo da non attivare effettivamente il dispositivo, nonostante l'uso della parola wake per dimostrare come viene utilizzato Echo?
Aurora0001

2
@ Aurora0001 Suppongo che oltre a quello che descrivo ci sia anche un metodo sulla falsariga di ciò che Sean menziona nella sua risposta impiegata. Alcuni filtri che tentano di ridurre i trigger di altri dispositivi.
Helmar

7

Bene, l'eco / Alexa sente sicuramente la richiesta. Se accedi alle tue impostazioni, scorri verso il basso fino a Generale, quindi seleziona la cronologia per riprodurre tutte le richieste che vengono ascoltate. Tutte le richieste che vengono ascoltate dallo spot dicono "Richiesta vocale non destinata al tuo Echo: non è stato restituito nulla".


2
Sembra un nuovo dettaglio della storia. Molto utile :)
Helmar

5

Se 1000 persone dicono la parola di avviso, avrà 1000 diverse firme acustiche. Se lo fanno di nuovo, un altro 1000.

Se 1000 Alexas sentono un programma TV che dice la parola di avviso, avrà 1000 delle stesse firme acustiche.

Non sarebbe così difficile rilevare questo lato server. Non da ultimo, perché se si verificano contemporaneamente, il server di registrazione vocale riceve uno schianto di traffico.

Se l'elenco di questi incidenti è piccolo, potrebbero persino scaricare le firme su ogni Alexa.


Inoltre, un utente che chiama Alexa suona come una parola di avviso di silenzio .

Un articolo di notizie suona come una parola d'allerta di bla bla bla . Una pubblicità suona come music_here parola-avviso. Non è affatto lo stesso.


5

La mia ipotesi totale è che nelle pubblicità di Echo, Alexa risponde alla domanda molto più rapidamente che nella realtà. Pertanto, l'Eco sta ascoltando la parola "Alexa" ma quasi immediatamente sente la stessa voce di Alexa che dà la risposta.

La mia eco si illumina quando la pubblicità si accende ma poi sembra chiudere l'avviso. Potrebbe esserci della logica per impedire a due Echo di rispondere a una richiesta se entrambi la ascoltano. L'Eco può essere progettato per ascoltare in modo specifico la voce di Alexa e ignorarla.

Tuttavia, come ho detto, questa è un'ipotesi totale. :)


Stavamo pensando la stessa cosa, quindi abbiamo messo in pausa il DVR tra la richiesta di Alexa e la sua risposta nella pubblicità. Il nostro eco si è ancora svegliato, ma poi si è ritirato senza rispondere, identico a quello che succede quando non abbiamo messo in pausa il DVR.
ViperGeek,

Ho intenzione di provarlo per anni e continuare a dimenticare. Questa è un'altra cosa fuori dalla lista delle cose da fare, grazie. :)
Andy Jones,

4

A seguito di recenti nuovi rapporti secondo cui Alexa può essere sensibile ai suoni UHF ( riferimento BBC News Sevice ), postulerei che durante le pubblicità trasmettessero un suono aggiuntivo oltre l'udito umano, che è designato come un comando "ignora questo comando".

In base alla suddetta capacità di Alexa di distinguere tra le voci degli utenti, questa è una funzionalità pianificata ma non ancora implementata. cioè devi comandare attivamente ad Alexa di passare da un account utente all'altro della stessa famiglia.

L'unico dispositivo attualmente abilitato a differenziare le voci è il dispositivo Google.


1

Quando mescolano l'audio dell'annuncio, rimuovono semplicemente alcune frequenze. Ciò significa che Alexa non verrà attivato in quanto non lo registrerà come comando vocale, ma gli spettatori possono ancora capire cosa stanno dicendo nella pubblicità.

Probabilmente noterai anche che quando il comando viene pronunciato nelle pubblicità, suona un po 'magro o confuso. Ecco perché :)


Interessante; questo è un po 'simile a quello che ha suggerito Sean . Hai qualche fonte o esperienza di questo che potresti condividere per dimostrare che la rimozione della frequenza è il caso? Potrebbe essere una cosa interessante da indagare.
Aurora0001
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.