Se ho un normale multivariato nel campione e definisco (che è una specie di distanza di Mahalanobis [al quadrato] da un punto campione al vettore a usando la matrice A per la ponderazione), qual è la distribuzione di d_i ^ 2 (\ bar X, S) (distanza di Mahalanobis al media campionaria \ bar X utilizzando la matrice di covarianza del campione S )?
Sto guardando un documento che afferma che è , ma questo è ovviamente sbagliato: la distribuzione sarebbe stata ottenuta per usando il vettore medio (sconosciuto) della popolazione e matrice di covarianza. Quando vengono collegati gli analoghi di esempio, si dovrebbe ottenere una distribuzione Hotelling o una distribuzione F in scala (\ cdot) o qualcosa del genere, ma non il . Non sono riuscito a trovare il risultato esatto né in Muirhead (2005) , né in Anderson (2003) , né in Mardia, Kent e Bibby (1979, 2003). Apparentemente, questi ragazzi non si sono preoccupati di una diagnostica esterna, poiché la distribuzione normale multivariata è perfetta e si ottiene facilmente ogni volta che si raccolgono dati multivariati: - /.
Le cose potrebbero essere più complicate di così. Il risultato della distribuzione T ^ {\ 2} di Hotelling si basa sull'assunzione di indipendenza tra la parte vettoriale e la parte matrice; tale indipendenza vale per e , ma non è più vale per e .