40 anni fa, potresti aver avuto un computer in cui la CPU controllava direttamente l'altoparlante. Quei tempi sono finiti, molto tempo fa.
Potresti avere un computer con una scheda audio primitiva. Una tale scheda audio avrà un buffer per i campioni audio stereo, quel buffer può essere riempito, la funzione di uscita verrà avviata e la scheda audio inizierà a generare audio dai campioni nei suoi buffer, senza che la CPU debba fare nulla. Tutto quello che la CPU deve fare è riempire i buffer con più campioni audio prima che si esauriscano. Se hai un buffer da un megabyte, sono 250.000 campioni stereo in qualità CD, sono circa sei secondi. Quindi, ogni pochi secondi, la CPU deve riempire nuovamente questi buffer.
In realtà, il tuo computer avrà qualcosa di molto più avanzato. In linea di principio lo stesso, ma i buffer possono essere riempiti direttamente con l'audio in formato mp3 o aac, ad esempio, e la scheda audio decodificherà questi dati in campioni stereo da soli. Molto probabilmente può essere programmato per produrre tutti i tipi di effetti diversi, dal volume del suono, migliorando la qualità del suono, modificando il tono o la velocità in modo indipendente, generando il suono surround e così via.
La CPU non fa molto, riempie di tanto in tanto i buffer audio. Il resto è fatto da qualcos'altro. Ovviamente quando dico "scheda audio", queste si sono ridotte da schede audio a chip a un piccolo granello di transistor su un chip enorme con molte funzionalità diverse.
Per un produttore di tali carte, guarda https://en.wikipedia.org/wiki/Wolfson_Microelectronics come punto di partenza.