(La risposta che segue semplicemente introduce e afferma il teorema dimostrato in [0]. La bellezza di quel documento è che la maggior parte degli argomenti sono fatti in termini di algebra lineare di base. Per rispondere a questa domanda sarà sufficiente indicare i risultati principali ma in ogni caso, vai a controllare la fonte originale).
In qualsiasi situazione in cui il modello multivariato dei dati può essere descritto da una distribuzione ellittica di variabile, l'inferenza statistica ridurrà, per definizione, al problema di adattare (e caratterizzare) un vettore di posizione di k variabile (diciamo θ ) e unkkθ di k matrice definita semi-positiva simmetrica (diciamo Σ ) ai dati. Per i motivi che spiegherò di seguito (ma che già assumi come premesse), sarà spesso più significativo scomporre Σ in un componente di forma (una matrice SPSD della stessa dimensione di Σ ) tenendo conto della forma dei contorni di densità della tua distribuzione multivariata e uno scalare σ SkkΣΣΣσS esprimere la scala di questi contorni.
In dati univariati ( k=1 ), , la matrice di covarianza dei tuoi dati è scalare e, come seguirà dalla discussione di seguito, la componente di forma di Σ è 1 in modo che Σ sia uguale alla sua componente di scala Σ = σ S sempre e nessuna ambiguità è possibile.ΣΣΣΣ=σS
In dati multivariati, molti scelta di scalare funzioni sono possibili. Uno in particolare ( σ S = | ΣσS ) si distingue per avere una proprietà desiderabile chiave. Questo dovrebbe renderlo la scelta preferita del fattore di ridimensionamento nel contesto delle famiglie ellittiche.σS=|ΣΣ|1/k
Molti problemi nelle statistiche MT implicano la stima di una matrice di dispersione, definita come una funzione (al)
simmetrica semi positiva definita in R k × k e soddisfacente:ΣRk × k
(per matrici non singolari A e vettori b ). Ad esempio la stima classica della covarianza soddisfa (0) ma non è affatto l'unica.
( 0 )Σ( Una X+ b ) = A Σ( X) A⊤
UNB
In presenza di dati distribuiti ellittici, in cui tutti i contorni di densità sono ellissi definiti dalla stessa matrice di forme, fino alla moltiplicazione per uno scalare, è naturale considerare le versioni normalizzate di della forma:Σ
VS= Σ/ S( Σ)
dove è una funzione monogena che soddisfa:S
( 1 )S( λ Σ) = λ S( Σ)
per tutto . Poi, V S è chiamato il componente forma della matrice di dispersione (in matrice forma corta) e σ S = S 1 / 2 ( Σ )λ > 0VSσS= S1 / 2( Σ) è detta componente scala della matrice di dispersione. Esempi di problemi di stima multivariata in cui la funzione di perdita dipende solo da attraverso la sua componente di forma V S includono, tra gli altri, test di sfericità, PCA e CCA.ΣVS
Naturalmente, ci sono molte possibili funzioni di ridimensionamento, quindi questo lascia ancora aperta la questione di quale (se presente) delle diverse scelte della funzione di normalizzazione sia in un certo senso ottimale. Per esempio:S
- (ad esempio quello proposto da @amoeba nel suo commento sotto la domanda del PO. Vedi anche [1], [2], [3])S= tr ( Σ) / k
- ([4], [5], [6], [7], [8])S= | Σ|1 / k
- (la prima voce della matrice di covarianza)Σ11
- (il primo autovalore di Σ )λ1( Σ)Σ
Tuttavia, è l'unica funzione di ridimensionamento per la quale la matrice Informazioni Fisher per le corrispondenti stime di scala e forma, in famiglie localmente asintoticamente normali, sono a blocchi diagonali (ovvero le componenti di scala e forma del problema di stima sono asintoticamente ortogonali) [0 ]. Ciò significa, tra l'altro, che la scala funzionaleS=| Σ | 1 / k è l'unica scelta diSper la quale la non specifica diσS= | Σ|1 / kS= | Σ|1 / kS non provoca alcuna perdita di efficienza durante l'esecuzione di inferenza sui V S .σSVS
Non conosco alcuna caratterizzazione di ottimalità relativamente forte per nessuna delle molte possibili scelte di che soddisfano (1).S
- [0] Paindaveine, D., Una definizione canonica di forma, Lettere statistiche e di probabilità, Volume 78, Numero 14, 1 ottobre 2008, Pagine 2240-2247. Link non associato
- [1] Dumbgen, L. (1998). Sulla funzione M di Tyler di scatter in alta dimensione, Ann. Inst. Statist. Matematica. 50, 471–491.
- [2] Ollila, E., TP Hettmansperger e H. Oja (2004). Metodi di segno multivariato equivariante affine. Preprint, Università di Jyvaskyla.
- [3] Tyler, DE (1983). Robustezza ed efficienza delle matrici scatter, Biometrika 70, 411–420.
- [4] Dumbgen, L. e DE Tyler (2005). Sulle proprietà di scomposizione di alcuni funzionali M multivariati, Scand. J. Statist. 32, 247–264.
- [5] Hallin, M. e D. Paindaveine (2008). Test ottimali basati sul rango per l'omogeneità dello scatter, Ann. Statista., Per apparire.
- [6] Salibian-Barrera, M., S. Van Aelst e G. Willems (200 6). Analisi dei componenti principali basata su stimatori MM multivariati con bootstrap veloce e robusto, J. Amer. Statist. Assoc. 101, 1198–1211.
- [7] Taskinen, S., C. Croux, A. Kankainen, E. Ollila e H. O ja (2006). Funzioni di influenza ed efficienza della correlazione canonica e stime vettoriali basate su matrici scatter e shape, J. Multivariate Anal. 97, 359–384.
- [8] Tatsuoka, KS e DE Tyler (2000). Sull'unicità di S-funzionali e M-funzionali in distribuzioni non ellittiche, Ann. Statist. 28, 1219–1243.