Esiste una definizione accettata per la mediana di un campione sul piano o spazi ordinati più alti?


Risposte:


19

Non sono sicuro che esista una definizione accettata per una mediana multivariata. Quello con cui ho familiarità è il punto mediano di Oja , che minimizza la somma dei volumi di simplices formati su sottoinsiemi di punti. (Vedi il link per una definizione tecnica.)

Aggiornamento: il sito di riferimento per la definizione di Oja sopra ha anche un bel documento che copre una serie di definizioni di una mediana multivariata:


1
Bel riferimento: grazie. Copre in modo completo tutto ciò che è menzionato qui.
whuber

Lo stesso sito web contiene anche una panoramica completa in html: cgm.cs.mcgill.ca/~athens/Geometric-Estimators/intro.html
Aditya

15

Come ha detto @Ars non ci sono definizioni accettate (e questo è un buon punto). Esistono famiglie alternative generali di modi per generalizzare i quantili su , penso che i più significativi siano:Rd

  • Generalizzare il processo quantile Sia la misura empirica (= la proporzione di osservazioni in A ). Poi, con A un sottoinsieme ben scelto del Boreliani in R d e λPn(A)AARdλ un vero e proprio valore misura, è possibile definire la funzione quantile empirica:

    Un(t)=inf(λ(A):Pn(A)tAA)

    Supponiamo che si può trovare uno che ti dà il minimo. Allora l'insieme (o un elemento del set) A 1 / 2 - εA 1 / 2 + ε ti dà la mediana quando ε è fatto abbastanza piccolo. La definizione della mediana viene recuperata quando si utilizza A = ( ] - , x ] x R ) e λ ( ] - , x ] ) =AtA1/2ϵA1/2+ϵϵA=(],x]xR) . Arsλ(],x])=xla risposta rientra in quel quadro immagino ... la posizione del mezzo spazio di tukey può essere ottenuta usando e λ ( H x ) = x (con x R , un R dA(a)=(Hx=(tRd:a,tx)λ(Hx)=xxRaRd ).

  • definizione variational e M-stima L'idea qui è che il -quantile Q α di una variabile casuale Y in RαQαYR può essere definita attraverso un'uguaglianza variazionale.

    • La definizione più comune sta usando la funzione di regressione quantile (nota anche come perdita di flipper, indovina perché?) Q α = a r g inf x R E [ ρ α ( Y - x ) ] . Il caso α = 1 / 2ρ 1 / 2 ( y ) = | y | e puoi generalizzare a una dimensione superiore usando l 1ραQα=arginfxRE[ρα(Yx)]α=1/2ρ1/2(y)=|y|l1 distanze come fatto in@Srikant Answer . Questa è una mediana teorica ma ti dà una mediana empirica se sostituisci l'attesa con l'attesa empirica (media).

    • Ma Kolshinskii propone di usare la trasformata di Legendre-Fenchel: poiché dove f ( s ) = 1Qα=Argsups(sαf(s))persR. Dà molte ragioni profonde per questo (vedi l'articolo;)). Generalizzando questo per dimensioni superiori richiedono che lavora con un vettorialeαe sostituendosαdas,αma si può prendereα=(1/2,...,1/2).f(s)=12E[|sY||Y|+s]sRαsαs,αα=(1/2,,1/2)

  • Ordinamento parziale È possibile generalizzare la definizione di quantili inRd non appena è possibile creare un ordine parziale (con classi di equivalenza).

Ovviamente ci sono ponti tra le diverse formulazioni. Non sono tutti evidenti ...


Bella risposta, Robin!
Ars

12

Esistono modi distinti per generalizzare il concetto di mediana a dimensioni superiori. Uno non ancora menzionato, ma che è stato proposto molto tempo fa, è quello di costruire uno scafo convesso, staccarlo e iterare il più a lungo possibile: ciò che rimane nell'ultimo scafo è un insieme di punti che tutti i candidati devono essere " mediane ".

"Head banging" è un altro tentativo più recente (c. 1980) di costruire un robusto centro per una nuvola di punti 2D. (Il collegamento è alla documentazione e al software disponibili presso il National Cancer Institute degli Stati Uniti.)

Il motivo principale per cui esistono molteplici generalizzazioni distinte e nessuna soluzione ovvia è che R1 può essere ordinato ma R2, R3, ... non può essere.


Any measure that coincides with the usual median when restricted to R1 is a candidate generalization. There must be a lot of them.
phv3773

phv:> one can ask for 'the' generalization to preserve (in higher dimensions) some of the interesting properties of the median. This severly limits the number of candidates (see the commenting after Srikant's answer below)
user603

@Whuber:> then notion of ordering can be generalized to R^n for unimodal distributions (see my answer below).
user603

@kwak: potresti elaborare un po '? La solita definizione matematica di un ordinamento di uno spazio è indipendente da qualsiasi tipo di distribuzione di probabilità, quindi è necessario avere implicitamente in mente alcune ipotesi aggiuntive.
whuber

1
@Whuber:> Dichiari: "R1 può essere ordinato ma R2, R3, ... non può essere". R2, .., R3 possono essere ordinati in molti modi mappando da Rn a R. Uno di questi è la profondità del tufo. Ha molte proprietà importanti (robustezza in qualche modo, non parametriche, invarianza, ...) ma queste valgono solo per le distribuzioni unimodali. Fammi sapere se vuoi maggiori dettagli.
user603


6

The Tukey halfspace median can be extended to >2 dimensions using DEEPLOC, an algorithm due to Struyf and Rousseeuw; see here for details.

The algorithm is used to approximate the point of greatest depth efficiently; naive methods which attempt to determine this exactly usually run afoul of (the computational version of) "the curse of dimensionality", where the runtime required to calculate a statistic grows exponentially with the number of dimensions of the space.



0

I do not know if any such definition exists but I will try and extend the standard definition of the median to R2. I will use the following notation:

X, Y: the random variables associated with the two dimensions.

mx, my: the corresponding medians.

f(x,y): the joint pdf for our random variables

To extend the definition of the median to R2, we choose mx and my to minimize the following:

E(|(x,y)(mx,my)|

The problem now is that we need a definition for what we mean by:

|(x,y)(mx,my)|

The above is in a sense a distance metric and several possible candidate definitions are possible.

Eucliedan Metric

|(x,y)(mx,my)|=(xmx)2+(ymy)2

Computing the median under the euclidean metric will require computing the expectation of the above with respect to the joint density f(x,y).

Taxicab Metric

|(x,y)(mx,my)|=|xmx|+|ymy|

Computing the median in the case of the taxicab metric involves computing the median of X and Y separately as the metric is separable in x and y.


Srikant:> No. The definition has to have two important feature of the univariate median. a) Invariant to monotone transformation of the data, b) robust to contamination by outliers. None of the extentions you propose have these. The Tukey depth has these qualities.
user603

@kwak What you say makes sense.

@Srikant:> Check the R&S paper cited by Gary Campbell above ;). Best,
user603

@kwak On thinking some more, the taxicab metric does have the features you mentioned as it basically reduces to univariate medians. no?

2
@Srikant:> there are no incorrect answer to phv's questions because there are no 'good answers' either; this area of research is still under development. I simply wanted to point out why it is still an open problem.
user603
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.