Massimo ritardo audio prima che il lettore se ne accorga?


38

Dato un evento in un gioco, qual è il ritardo massimo nella produzione di audio che il giocatore associerà correttamente l'audio a quell'evento (e non a percepire il ritardo)?


Non tanto. Immagino che debba essere meno di 1/10 di secondo. Anche se personalmente, potrei notarlo se fosse più di qualche fotogramma a 60 FPS.
Almo,

Non dimenticare che nella maggior parte dei casi anche l'output di rendering avrà qualche ritardo, alcuni dei quali provengono dal monitor. Possono essere necessari più di 100 ms per visualizzare il risultato dell'input del giocatore sullo schermo. Vedi anandtech.com/show/2803
Adam

1
Sono circa 20 millisecondi quando si suona uno strumento, circa 80 millisecondi quando si è in ascolto. Questa è solo la mia esperienza personale, il tuo chilometraggio può variare.
rwols

Più di qualsiasi momento specifico hai bisogno di coerenza. Finché tutto ha lo stesso ritardo, puoi essere ragionevole. Se tutto è in ritardo di 100 ms, potresti non notarlo, ma se alcuni suoni sono quasi istantanei e il resto è di 100 ms o qualcosa nel mezzo, noterai.
0xFADE

Se sei in qualche modo interessato a una sorta di comportamento realistico, potresti considerare alcuni ritardi per eventi lontani dall'ascoltatore come qualcosa di positivo.
Darkwings

Risposte:


48

I seguenti risultati vengono calcolati per la sincronizzazione labiale che è considerata "l'errore di sincronizzazione a / v più evidente" .


Dice Wikipedia

Per le applicazioni televisive, l'audio dovrebbe condurre i video per non più di 15 millisecondi e l'audio dovrebbe ritardare i video per non più di 45 millisecondi. Per il film, la sincronizzazione labiale accettabile non è considerata superiore a 22 millisecondi in entrambe le direzioni.


Dice il Media and Acoustics Perception Lab

I risultati dell'esperimento hanno determinato che la soglia iniziale audio media per il rilevamento della sincronizzazione audio / video era 185,19 ms, con una deviazione standard di 42,32 ms


L'ATSC dice

A prima vista sembra sciolto: da +90 ms a -185 ms come una "finestra di accettabilità"

e

  • Non rilevabile da -100 ms a +25 ms
  • Rilevabile a -125 ms e +45 ms
  • Diventa inaccettabile a -185 ms e +90 ms

(- Suono ritardato, + Suono avanzato)


Concludere

I risultati non sono così lontani l'uno dall'altro. Sembra che il ritardo massimo accettabile sia di circa 150 ms, ovvero 9 frame a 60 frame al secondo.


3
"Se hai un ritardo, dovrebbe essere il video a essere ritardato." sembra che dovrebbe essere invertito, l'articolo ATSC afferma chiaramente che le persone si aspettano / tollerano che il suono si verifichi un po 'dopo la vista (poiché nella vita reale il suono è in ritardo di circa 1 ms per piede di distanza), ma non associare correttamente gli eventi se l'evento video si verifica dopo il suono.
Peteris,

Hai ragione, ho completamente frainteso. Grazie. (Ho curato)
Heckel,

1
Posso dirti per esperienza personale che questo varia anche tra le orecchie nella stessa persona. Ho una rara condizione vestibolare che in realtà fa sì che il mio cervello elabori stimolazione uditiva nell'orecchio sinistro ritardato misurabile rispetto all'orecchio destro. In una brutta giornata questo provoca vertigini, ma il più delle volte è tollerabile. Quindi sì, questo è estremamente soggettivo.
Andon M. Coleman,

Dove ottieni 150 ms? Le tue fonti hanno una media di circa 45ms.
Miles Rout,

Wikipedia dice 45ms, ma non è necessariamente la fonte più affidabile. La seconda fonte dice 185.19 ms e la terza 125ms fino a quando non diventa evidente. Puoi citare la fonte per aiutarmi a capire dove sbaglio?
Heckel,

9

Dipende dall'evento

La sensazione che, per esempio, un'esplosione che vedi e ascolti sia un singolo evento avrà le tolleranze descritte in altre risposte - non più di ~ 50ms; alcune persone potrebbero essere più sensibili (ad esempio i musicisti), quindi suggerirei di puntare a 30 ms o non più di 2 fotogrammi a 60 fps.

Credo che la distanza percepita dovrebbe influenzare tali tolleranze. Le persone si aspettano che i suoni lontani siano leggermente ritardati, poiché nella vita reale il suono è in ritardo di circa 1 ms per ogni piede di distanza. Quindi un'esplosione su una 'mappa' di gioco RTS ingrandita potrebbe avere una tolleranza maggiore per il ritardo del suono rispetto al giocatore che spara la propria pistola in un FPS.

Casi specializzati, come avere la sensazione giusta per un gioco di musica / ritmo possono richiedere tolleranze molto più strette, 15-20ms o anche più basse - per esempio, se il giocatore sente entrambe le "azioni di input" come cantare in un microfono o battere un strumento di plastica, e anche un suono generato dal tuo sistema per lo stesso evento, un ritardo di 50ms farà sì che i suoni "originali" e "suonati" si mescolino in modo strano.

Inoltre, tieni presente il ritardo tra l'inizio del file audio e "l'evento" all'interno di quel file audio - in molte clip audio, "l'evento" non sarà proprio al limite, potresti avere il suono di un fulmine sciopero in cui lo "sciopero" si verifica 200 ms dopo l'inizio, il che sarebbe ovvio per tutti, e praticamente tutti i file audio, anche un colpo di batteria, avranno qualche ritardo lì.

Non misurare le medie - guarda nel caso peggiore

La vista e l'udito sono profondamente collegati nella percezione umana e se uno di loro balbetta relativamente all'altro, sarà percepibile. Non va bene se la maggior parte delle volte è molto veloce ma a volte c'è un ritardo di 0,2 secondi mentre qualcosa si sta caricando - le persone noteranno tali situazioni. Questo è il motivo per cui l'audio viene spesso eseguito su un thread separato, isolato dalle altre attività e riceve semplicemente notifiche rapide su quali clip precaricate devono essere riprodotte.


5

Ogni situazione in cui un giocatore causa il suono (giochi musicali, pistole in FPS) avrà bisogno di un ritardo molto basso poiché il giocatore ha inviato l'impulso per farlo accadere in quel momento, così come quando un musicista ascolta il suo strumento in ritardo, sarà particolarmente consapevole di ritardi molto piccoli. Gli ingegneri del suono si preoccupano dei ritardi di registrazione inferiori a 5 mSec rovinando il "groove"

Il Journal of American Academy of Audiology afferma che le persone (non solo i musicisti), quando ascoltano la propria voce in ritardo, sono consapevoli di ritardi brevi di 3mSec, e un ritardo superiore a 10 mSec era discutibile il 90% delle volte.

Gli esseri umani usano il ritardo tra le loro orecchie per informazioni direzionali e quindi devono essere in grado di elaborare ed estrarre informazioni da ritardi inferiori a 1mSec

I 185.19 ms citati sopra sono irrilevanti in quanto si riferiscono a un grave errore sonoro e comunque a ciò che la gente ha trovato accettabile quando guardava passivamente un film, non attivamente coinvolto in un gioco.


4

La risposta accettata qui discute principalmente sulla percezione della sincronizzazione audio nella visione passiva del video. In questi casi, il pubblico non può facilmente individuare esattamente quando l'audio dovrebbe essere riprodotto se non assistendo a segni rivelatori nel video. Ciò significa che hanno un'anticipazione limitata del suono.

Ci sono due casi importanti nei giochi in cui questo presupposto di bassa anticipazione non regge:

  1. Quando il giocatore stesso ha causato il suono (come sottolinea SamB), quindi dal momento in cui formano l'intenzione di premere il pulsante, sanno esattamente quando si aspettano di sentire il suono.

  2. Quando il suono dovrebbe atterrare su un battito periodico , come nei giochi musicali o in qualsiasi cosa con un timer / contatore che ticchetta, questo ritmo consente al giocatore di anticipare il suono successivo e notare se viene riprodotto fuori tempo.

In questo discorso di GDC 2013, Mathieu Pavageau sostiene che i giocatori possono percepire differenze nella precisione della sincronizzazione superiori a circa 5 ms , molto meno tolleranti di quanto suggerirebbero gli esempi di sincronizzazione labiale. Dai un'occhiata alle sezioni "Esempi di percezione del tempo" ed "Esempio di giochi Ubisoft" per ascoltarlo tu stesso. Puoi sentire che il menu di Rayman Origins non suona "in ritardo" di per sé se sincronizzato entro 16 ms (fotogramma video), ma quando sincronizzato entro 5 ms suona notevolmente meglio e più stretto.

Pavageau consiglia di utilizzare un callback audio di basso livello per ottenere questo tipo di precisione del sub-frame se si desidera un gameplay ritmico di questa varietà.


2

Per i giochi che richiedono a una persona di reagire ai segnali audio, ogni millisecondo in cui il suono viene ritardato farà ritardare allo stesso modo la risposta della persona. Qualcuno che sta semplicemente guardando un film o una scena tagliata potrebbe non notare troppo se l'audio e il video non sono esattamente sincronizzati, ma è spesso importante e talvolta fondamentale che l'audio sia sincronizzato con ciò che il giocatore dovrebbe fare .


-1

In teoria, tutto ciò che supera i 50ms può essere evidente quando si tratta dell'associazione alle immagini, a 25ms puoi iniziare a sentire un suono e il suo ritardo come due suoni separati, quindi direi che ti consiglio vivamente di rimanere sotto i 50ms e se può anche stare a qualcosa da 5ms a 15ms sarebbe davvero bello.

Spero che questo ti possa aiutare!

https://en.wikipedia.org/wiki/Delayed_Auditory_Feedback


Questa risposta non aggiunge alcun nuovo consiglio non già presente nelle risposte esistenti, quindi rischia di venire fuori come una semplice spina o pubblicità per le informazioni di contatto della tua azienda. StackExchange non è destinato alla promozione di servizi, quindi ti consiglio di rimuovere quella porzione (la gente può ancora cercarti con il tuo nome utente) e di aggiungere maggiori dettagli sul perché consiglieresti tempistiche particolari oltre a quelle trattate nelle risposte esistenti.
DMGregory

Nessuna delle risposte che abbiamo visto era giusta per noi, siamo un team di ingegnere del suono e l'acustica è la prima cosa che abbiamo imparato. alcune risposte dicevano oltre 100 milioni mentre altre dicevano -100 e + 85 come questa è persino una risposta? -50ms o + 50ms ancora 50ms di differenza tra azione e suono. stiamo solo cercando di aiutare se dare la nostra e-mail è quell'offensiva che la rimuoveremo.
X-Raysounds,

Vedi, ad esempio, la risposta di Peteris di 3 anni fa, che fornisce lo stesso limite superiore assoluto di 50 ms e raccomanda di abbassare la risposta, oppure il riferimento al discorso di Mathieu Pavageau che raccomanda 5ms come obiettivo ideale. Questo sembra coprire la gamma di ciò che è contenuto in questa risposta, a meno che tu non voglia espandere le raccomandazioni? Ad esempio, se ci sono dettagli dal link di Wikipedia che ritieni rilevanti, è buona norma riassumerli almeno nel testo della risposta (nel caso in cui la pagina collegata cambi in futuro).
DMGregory

Ah scusate per il fatto che non abbiamo letto tutte le risposte che ne saltiamo alcune, poi abbiamo detto quello che sappiamo e lo abbiamo applicato con un link di Wikipedia, siamo ancora principianti nel forum, stiamo cercando di dare un po 'di aiuto sul suono problemi correlati ma non abbiamo trovato molto haha
X-Raysounds,

Nessun problema. Il coaching di nuovi utenti è uno dei motivi per cui esistono questi commenti. :) Riceverai le risposte StackExchange abbastanza rapidamente - significa solo pensarle come risorse di riferimento a lungo termine, piuttosto che come risposte nel forum.
DMGregory
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.