Tendo a sentire che di solito 3 autovalori maggiori sono i più importanti, mentre quelli vicini allo zero sono rumore
Puoi provarlo. Vedi l'articolo collegato in questo post per maggiori dettagli. Ancora una volta, se hai a che fare con serie temporali finanziarie, potresti voler prima correggere la leptokurticity (vale a dire, considera la serie di rendimenti aggiustati per i trucchi, non i rendimenti grezzi).
Ho visto alcuni articoli di ricerca che studiano come le distribuzioni di autovalori presenti in natura differiscano da quelle calcolate da matrici di correlazione casuali (di nuovo, distinguendo il rumore dal segnale).
Edward:> Di solito, uno lo farebbe al contrario: guarda la distribuzione multivariata di autovalori (di matrici di correlazione) provenienti dall'applicazione che desideri. Una volta identificato un candidato credibile per la distribuzione di autovalori, dovrebbe essere abbastanza facile generare da essi.
La migliore procedura su come identificare la distribuzione multivariata dei tuoi autovalori dipende da quante risorse vuoi considerare simultaneamente (cioè quali sono le dimensioni della tua matrice di correlazione). C'è un trucco accurato se ( p è il numero di attività).p ≤ 10p
Modifica (commenti di Shabbychef)
procedura in quattro passaggi:
- Supponiamo di avere sottocampioni di dati multivariati. È necessario uno stimatore della matrice varianza-covarianza ˜ C j per ciascun sottocampione j (è possibile utilizzare lo stimatore classico o una valida alternativa come l' MCD veloce , che è ben implementato in matlab, SAS, S, R ,. ..). Come al solito, se hai a che fare con serie temporali finanziarie, dovresti prendere in considerazione la serie di rendimenti adeguati all'andamento, non rendimenti grezzi.j = 1 , . . . , JC~jj
- Per ogni sottocampione , calcolare ˜ Λ j = log ( ˜ λ j 1 ) , ..., log ( ˜ λ j p ) , i valori di automa di ˜ C j .jΛ~j= log( λ~j1)log( λ~jp)C~j
- Calcola , lo scafo convesso della matrice J × p la cui j-esima voce è ˜ Λ j (di nuovo, questo è ben implementato in Matlab, R, ...).CV( Λ~)J× pΛ~j
- Disegnare punti a caso dall'interno (questo fatto dando peso w i a ciascuno dei bordi di C V ( ~ Λ ) dove w i = γ iCV( Λ~)wioCV( Λ~) , doveγiè un'estrazione da un'unità di distribuzione esponenziale (maggiori dettagliqui).wio= γioΣpi = 1γioγio
Una limitazione è che il calcolo rapido dello scafo convesso di una serie di punti diventa estremamente lento quando il numero di dimensioni è maggiore di 10. J≥ 2