Riduzione al minimo della somma della deviazione assoluta (


15

Ho un set di dati e voglio trovare il parametro modo tale da ridurre al minimo la somma questo èx1,x2,,xkm

i=1k|mxi|.

minmi=1k|mxi|.

2
Potresti elaborare un po '?
Geoff Oxberry,

In tal caso, la soluzione non sarebbe quindi il punto medio tra i valori massimo e minimo?
Paul

@Paul la mediana può minimizzare la somma ma vuoi sapere come potrebbe essere fatto analiticamente, in particolare la minimizzazione l1
rinnovare il

@kadu esatto, la mediana è la soluzione. Il calcolo analitico della mediana è banale; basta ordinare e quindi prendere il valore medio.
David Ketcheson,

Risposte:


22

Probabilmente chiedi una prova che la mediana risolva il problema? Bene, questo può essere fatto in questo modo:

L'obiettivo è lineare a tratti e quindi differenziabile ad eccezione dei punti . Qual è la pendenza dell'obiettivo è un punto ? Bene, la pendenza è la somma delle pendenze delle mappaturee questo è (per ) o (per ). Quindi, la pendenza indica quanti sono più piccoli di . Vedete che la pendenza è zero se ci sono ugualmente molti più piccoli e più grandi di (per e numero pari di ). Se c'è un numero dispari di m x i m | m - x j | + 1 m > x j - 1 m < x j x i m x i m x i x i - 1 + 1m=ximxim|mxj|+1m>xj1m<xjximximxixiQuindi la pendenza è sinistra di quella "media" e destra, quindi la minima è la minima.1+1


16

Una generalizzazione di questo problema a più dimensioni è chiamata problema mediano geometrico . Come sottolinea David, la mediana è la soluzione per il caso 1-D; lì, è possibile utilizzare algoritmi di selezione di ricerca mediana , che sono più efficienti dell'ordinamento. Gli ordinamenti sono mentre gli algoritmi di selezione sono O ( n ) ; gli ordinamenti sono più efficienti solo se sono necessarie selezioni multiple, nel qual caso è possibile ordinare (in modo costoso) una volta, quindi selezionare più volte dall'elenco ordinato.O(nlogn)O(n)

Il collegamento al problema geometrico mediano menziona soluzioni per casi multidimensionali.


6

La soluzione esplicita in termini di mediana è corretta, ma in risposta a un commento di Mayenew, ecco un altro approccio.

È noto che problemi di minimizzazione in generale, e in particolare il problema pubblicato, possono essere risolti mediante la programmazione lineare.1

La seguente formulazione LP farà per l'esercizio dato con incognite :zi,m

tale che: z im - x i z ix i - m

minzi
zimxi
zixim

Chiaramente deve uguagliare | x i - m | come minimo, quindi questo richiede di minimizzare la somma dei valori assoluti degli errori.zi|xim|


2

Il modo di analisi convesso sovradimensionato per dimostrare questo è solo prendere i subgradients. In realtà questo equivale al ragionamento usato in alcune delle altre risposte che riguardano le pendenze.

|mxi|

m<xi

m=xi

m>xi

mx1,xk


0

argminmi=1N|mxi|

d|x|dx=sign(x)L1
i=1Nsign(mxi)
m=median{x1,x2,,xN}

Si dovrebbe notare che il mediangruppo discreto non è definito in modo univoco.
Inoltre, non è necessariamente un elemento all'interno del gruppo.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.