Distribuzione di una distanza di Mahalanobis a livello di osservazione


23

Se ho un normale multivariato nel campione e definisco (che è una specie di distanza di Mahalanobis [al quadrato] da un punto campione al vettore a usando la matrice A per la ponderazione), qual è la distribuzione di d_i ^ 2 (\ bar X, S) (distanza di Mahalanobis al media campionaria \ bar X utilizzando la matrice di covarianza del campione S )?X1,,XnNp(μ,Σ)

di2(b,A)=(Xib)A1(Xib)
aA di2(X¯,S)X¯S

Sto guardando un documento che afferma che è χp2 , ma questo è ovviamente sbagliato: la distribuzione χp2 sarebbe stata ottenuta per di2(μ,Σ) usando il vettore medio (sconosciuto) della popolazione e matrice di covarianza. Quando vengono collegati gli analoghi di esempio, si dovrebbe ottenere una distribuzione Hotelling T 2 o una distribuzione F in scala (\ cdot)F() o qualcosa del genere, ma non il χp2 . Non sono riuscito a trovare il risultato esatto né in Muirhead (2005) , né in Anderson (2003) , né in Mardia, Kent e Bibby (1979, 2003). Apparentemente, questi ragazzi non si sono preoccupati di una diagnostica esterna, poiché la distribuzione normale multivariata è perfetta e si ottiene facilmente ogni volta che si raccolgono dati multivariati: - /.

Le cose potrebbero essere più complicate di così. Il risultato della distribuzione T ^ {\ 2} di Hotelling T 2si basa sull'assunzione di indipendenza tra la parte vettoriale e la parte matrice; tale indipendenza vale per X¯ e S , ma non è più vale per Xi e S .


Nella definizione di , vedi ancora come una variabile casuale o la stai trattando come un vettore fisso? Includere il pedice suggerisce quest'ultimo, ma sembra un po 'strano. di2Xi
whuber

1
Solo una piccola nota a , ma nota che è accessorio rispetto a e è uguale a una costante fissa ( dovrebbe essere , o simile, credo) quasi sicuramente. XiX¯μidi2(X¯,S)np
cardinale il

1
@whuber - forse per sottolineare che è calcolato usando un'osservazione dal campione, non una nuova osservazione?
jbowman,

1
@whuber, approssimativamente sulla falsariga di ciò che ha detto jbowman - per indicare che questa è una statistica a livello di osservazione (al contrario di una statistica a livello di campione, come la media campionaria).
StasK

1
La distribuzione di è una beta, , ma sto ancora cercando la distribuzione di . Le distribuzioni dei non sono indipendenti. n / ( n - 1 ) 2 d 2 i ( ˉ X , S ) B ( p / 2 , ( n - p - 1 ) / 2 ) d 2 i ( μ , S ) d 2 idi2(X¯,S)n/(n1)2di2(X¯,S)B(p/2,(np1)/2)di2(μ,S)di2

Risposte:


18

Scopri la modellizzazione della miscela gaussiana sfruttando la distanza di Mahalanobis ( collegamento alternativo ). Vedi pagina n. 13, seconda colonna. Gli autori hanno anche fornito alcune prove anche per derivare la distribuzione. La distribuzione è beta ridimensionata. Per favore fatemi sapere se questo non funziona per voi. Altrimenti potrei controllare qualsiasi suggerimento nel libro di SS Wilks domani.


4
La risposta fornita nel documento è: . Grazie! n(n1)2di2(X¯,S)B(p2,np12)
StasK

9

Ci sono 3 distribuzioni rilevanti. Come notato, se vengono utilizzati i parametri di popolazione reali, la distribuzione è chi-quadrato con . Questa è anche la distribuzione asintotica con parametri stimati e grandi dimensioni del campione.df=p

Un'altra risposta fornisce la distribuzione corretta per la situazione più comune, con parametri stimati quando l'osservazione stessa fa parte del set di stima: Tuttavia, se l'osservazionexiè indipendente dalle stime dei parametri, la distribuzione è proporzionale alla distribuzione del rapporto F di Fisher: (nd2(n-p)

n(d2)(n1)2Beta(p2,(np1)2).
xi
(nd2(np)(p(n1)(n+1))F(p,np)

Benvenuto nel sito, @JoeSullivan. Mi sono preso la libertà di usare LATEX

puoi dare un riferimento per la formula F?
eyaler

1
un riferimento correlato, sezione 3 in Hardin, Johanna e David M. Rocke. 2005. “The Distribution of Robust Distances.” Journal of Computational and Graphic Statistics 14 (4): 928–46. DOI: 10,1198 / 106186005X77685.
Josef,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.