Ho registrato una pronuncia di 2 secondi di un suono vocale. I primi 0,12 secondi circa del segnale sono mostrati di seguito.
Ora, ho costruito un modello di auto-regressione (AR) di 8 ° ordine per comprimere questo segnale. (In realtà, sto solo modellando 160 campioni o 0,02 secondi alla volta.) La ar
funzione nella Toolbox Identification System di Matlab può stimare i parametri per un adattamento dello spettro "ottimale".
Il mio problema è scegliere l'input stocastico al filtro del modello. Suppongo che ci sia qualcosa di meglio del rumore bianco. La periodicità (14 periodi per 0,02 secondi) mi porta a pensare che sarebbe adatto un treno di impulsi con lo stesso periodo.
In tal caso, come sceglierei l'ampiezza e come troverei la periodicità? Le stime ACF e PSD sono piuttosto rumorose. Sono anche sulla buona strada?