Ho un set di dati e voglio trovare il parametro modo tale da ridurre al minimo la somma questo è
Ho un set di dati e voglio trovare il parametro modo tale da ridurre al minimo la somma questo è
Risposte:
Probabilmente chiedi una prova che la mediana risolva il problema? Bene, questo può essere fatto in questo modo:
L'obiettivo è lineare a tratti e quindi differenziabile ad eccezione dei punti . Qual è la pendenza dell'obiettivo è un punto ? Bene, la pendenza è la somma delle pendenze delle mappaturee questo è (per ) o (per ). Quindi, la pendenza indica quanti sono più piccoli di . Vedete che la pendenza è zero se ci sono ugualmente molti più piccoli e più grandi di (per e numero pari di ). Se c'è un numero dispari di m ≠ x i m ↦ | m - x j | + 1 m > x j - 1 m < x j x i m x i m x i x i - 1 + 1Quindi la pendenza è sinistra di quella "media" e destra, quindi la minima è la minima.
Una generalizzazione di questo problema a più dimensioni è chiamata problema mediano geometrico . Come sottolinea David, la mediana è la soluzione per il caso 1-D; lì, è possibile utilizzare algoritmi di selezione di ricerca mediana , che sono più efficienti dell'ordinamento. Gli ordinamenti sono mentre gli algoritmi di selezione sono O ( n ) ; gli ordinamenti sono più efficienti solo se sono necessarie selezioni multiple, nel qual caso è possibile ordinare (in modo costoso) una volta, quindi selezionare più volte dall'elenco ordinato.
Il collegamento al problema geometrico mediano menziona soluzioni per casi multidimensionali.
La soluzione esplicita in termini di mediana è corretta, ma in risposta a un commento di Mayenew, ecco un altro approccio.
È noto che problemi di minimizzazione in generale, e in particolare il problema pubblicato, possono essere risolti mediante la programmazione lineare.
La seguente formulazione LP farà per l'esercizio dato con incognite :
tale che: z i ≥ m - x i z i ≥ x i - m
Chiaramente deve uguagliare | x i - m | come minimo, quindi questo richiede di minimizzare la somma dei valori assoluti degli errori.