Generalizzare il "trucco mediano" a dimensioni superiori?


22

Per gli algoritmi randomizzati assumono valori reali, il "trucco mediano" è un modo semplice per ridurre la probabilità di fallimento a qualsiasi soglia , al costo di solo una moltiplicativa overhead. Vale a dire, se l' output di cade in un "buon intervallo" con probabilità (almeno) , quindi eseguendo copie indipendenti e prendendo la mediana delle loro uscite si tradurrà in un valore che cade in con probabilità almeno dei limiti di Chernoff / Hoeffding. δ > 0 t = O ( registro 1Aδ>0AI=[a,b]2/3A1,...,Atun1,...,unatI1-δt=O(log1δ)AI=[a,b]2/3A1,,Ata1,,atI1δ

Esiste una generalizzazione di questo "trucco" a dimensioni più elevate, diciamo , dove la buona gamma è ora un insieme convesso (o una palla, o qualsiasi insieme sufficientemente bello e strutturato)? Cioè, dato un algoritmo randomizzato fornisce valori in e un "buon set" tale che per tutti , come si può aumentare la probabilità di successo a con solo un costo logaritmico in ?A R S S R d P r { A (x,r)S}2 / 3x1-δ1 / δRdARdSRdPr{A(x,r)S}2/3x1δ1/δ

(Frase diversa: dato fisso, arbirary con la garanzia che almeno di appartiene a , esiste una procedura in uscita un valore da ? In tal caso, ce n'è uno efficiente?)2 ta1,,atRd aiSS2t3aiSS

E qual è l'insieme minimo di presupposti di cui abbiamo bisogno su per ottenere quanto sopra?S

Scusami se questo risulta essere banale - Non sono riuscito a trovare un riferimento su questa domanda ...


3
Nel caso speciale in cui è un cuboide, funziona se usi il trucco mediano in ogni dimensione individualmente? Quindi campiona un gruppo di punti, quindi prendi la mediana delle loro coordinate nella dimensione 1, 2, ..., d, e quindi ottieni un punto in . Forse avrai bisogno di campioni con questa strategia? R d O ( log ( d / ϵ ) )SRdO(log(d/ϵ))
Robin Kothari,

1
Nel caso monodimensionale, di solito conosci ma non l'intervallo esatto (anche se anche se non conosci il trucco mediano funziona ancora). Dovremmo supporre di conoscere ma solo fino alla traduzione? Fino alla traduzione e al ridimensionamento? b - a SbabaS
Sasho Nikolov,

@SashoNikolov Suppongo che questa sarebbe la più "generalizzazione generale" (ad esempio, sappiamo solo che è una "buona palla di diametro "). εSε
Clemente C.,

1
Bene, ciò che Thomas ha scritto nella sua risposta è ancora più generale: presume che ( nella sua risposta) sia un insieme convesso sconosciuto. GSG
Sasho Nikolov,

Risposte:


17

Quello che stai cercando è quasi lo stesso una forte tendenza centrale : un modo per ridurre una nuvola di dati punta a un singolo punto, in modo tale che se molti dei punti dati sono vicini ad una "verità fondamentale", ma il resto di loro sono arbitrariamente lontani, quindi anche il tuo output sarà vicino alla verità fondamentale. Il "punto di rottura" di tale metodo è la frazione di valori erroneamente arbitrari che può tollerare. La differenza è che nel tuo caso vuoi sostituire "vicino a" con "all'interno dello scafo convesso di".

Un modo per catturare questo è con la nozione di profondità di Tukey. Un punto ha la profondità di Tukey (rispetto a una data serie di punti dati) se ogni semispazio contenente il punto dato contiene anche almeno punti dati . Se è presente un buon sottospazio convesso in cui si desidera trovarsi all'interno, un punto con profondità Tukey rimarrà all'interno fino a quando vi saranno almeno dei punti dati al suo interno. Quindi il punto di rottura di questo metodo è il valore più grande di che puoi ottenere.n p n p ( 1 - p ) n ppnpnp(1p)np

Purtroppo questo punto di rottura è , non vicino a 1/2, sia per la profondità di Tukey che per il tuo problema. Ecco perché: se i tuoi dati sono raggruppati vicino ai vertici di un simplex, allora fintanto che meno di di loro sono valori anomali (ma non sai quali) quindi qualsiasi punto in il simplex è sicuro da scegliere poiché sarà sempre all'interno dello scafo convesso dei non anomali. Ma se più di dei punti possono essere anomali, non c'è nessun posto sicuro da scegliere: qualunque punto del simplex si scelga, gli outlier potrebbero essere tutti i punti dal vertice simplex più vicino, e saresti fuori dallo scafo dei non-outlier.d + 1 1 / ( d + 1 ) 1 / ( d + 1 )1/(d+1)d+11/(d+1)1/(d+1)

Se sei disposto a tollerare un punto di rottura peggiore, più simile a , esiste un metodo randomizzato per trovare un punto profondo che è polinomiale sia in che in : vedi il mio documenton dO(1/d2)nd

Punti centrali approssimativi con punti radon ripetuti, K. Clarkson, D. Eppstein, GL Miller, C. Sturtivant e S.-H. Teng, 9 ° ACM Symp. Comp. Geom. , San Diego, 1993, pagg. 91–98, int. J. Comp. Geom. & Appl. 6 (3): 357–377, 1996, http://kenclarkson.org/center/p.pdf


Sì. Inoltre, vorrei menzionare che si possono usare approssimazioni eps-reti eps e i loro vari amici come un modo per ottenere un piccolo campione che approssima bene tali misure di profondità. Non ottieni un singolo punto, ma ottieni molte più informazioni.
Sariel Har-Peled,

Con la terminologia del tuo documento, esiste un modo efficace noto per verificare un rivendicato -center per numeri razionali ? βββ

Se per "efficiente" intendi il polinomio nella dimensione, allora non conosco un simile risultato. Il mio documento trova solo un punto, non ti dà ulteriori informazioni sulla distribuzione spaziale della profondità (come Sariel allude sopra).
David Eppstein,

Grazie! Mettendo da parte considerazioni sull'efficienza (per ora), questo sembra dire che per il caso generale di insiemi convessi arbitrari, non c'è modo di aumentare la probabilità costante a probabilità arbitraria? (poiché la frazione di punti positivi deve essere maggiore di ? (o mi sono perso qualcosa - ripensandoci, sembra che la seconda formulazione che ho non catturi l'idea di "ripetizioni indipendenti", in cui avremmo in manodiversiset di punti, ognuno dei quali almeno un2/3frazione di buoni punti).11d+12/3
Clement C.

1
Un punto, più punti o meno, se tutto quello che sai è che esiste un insieme convesso ma non dove si trova, e vuoi essere in grado di aumentare la probabilità di essere nell'insieme corretto per meglio quindi d / (d + 1), quindi la frazione di punti positivi deve essere almeno d / (d + 1) per aggirare l'esempio simplex. In caso contrario, un avversario potrebbe fornirti dati sotto forma di simplex e scegliere casualmente un vicinato epsilon di una faccia del simplex come set convesso; anche se indovini un punto vicino a un vertice del simplex a caso, avrai almeno 1 / (d + 1) probabilità di scegliere in modo errato.
David Eppstein,

14

Questa è una domanda chiara e ci ho pensato prima. Ecco cosa ci è venuto in mente:

Si esegue l'algoritmo volte per ottenere le uscite x 1 , , x nR d e sapete quello che con elevata probabilità una grande frazione di x i caduta s in qualche buon set G . Non sai cos'è G , solo che è convesso. La buona notizia è che esiste un modo per ottenere un punto in G senza ulteriori informazioni al riguardo. Chiama questo punto f ( x 1 , , x n ) .nx1,,xnRdxiGGGf(x1,,xn)

Teorema. Per tutti i numeri naturali e d , esiste una funzione f : ( R d ) nR d tale che vale quanto segue. Lascia x 1 . . . x nR d e lasciate G R d un insieme convesso soddisfacente 1ndf:(Rd)nRdx1...xnRdGRdQuindif(x1,...,Xn)G. Inoltre,fè calcolabile nel tempo polinomiale innd.
1n|{i[n]:xiG}|>dd+1.
f(x1,...,xn)Gfnd

Nota che, per , possiamo impostare f come mediana. Quindi questo mostra come generalizzare la mediana per d > 1 .d=1fd>1

Prima di provare questo risultato, nota che è stretto: Sia e sia x 1 , , x d gli elementi base standard e x d + 1 = 0 . Qualsiasi sottoinsieme di d dei punti è contenuto in uno spazio affine G di dimensione d - 1 (che è definito in modo univoco da quei punti). Ma nessun punto è contenuto in tutti quegli spazi affini. Quindi c'è qualche G convesso che contiene n d / ( d +n=d+1x1,,xdxd+1=0dGd1G punti ma non contiene f ( x 1 , , x n ) , qualunque sia il valore che assume.nd/(d+1)=df(x1,,xn)

Prova. Usiamo il seguente risultato.

Teorema di Helly. Lascia essere sottoinsiemi convessi di R d . Supponiamo che l'intersezione di qualsiasi d + 1 K i sia non vuota. Quindi l'intersezione di tutti i K è non vuota.K1...KmRdd+1 KiKi

Fai clic qui per una prova del teorema di Helly.

Ora per dimostrare il nostro teorema:

Lasciare è un limite superiore al numero di punti non in G . Considera tutti i semispazi chiusi K 1 . . . K mR d contenente almeno n - k punti con il loro limite contenente un insieme di punti di rango massimo (questo è un numero finito di semispazi come ogni K i è definito da d + 1 punti sul suo confine).k<n/(d+1)GK1...KmRdnkKid+1

Il complemento di ogni contiene al massimo k punti. Di un limite di unione, l'intersezione qualsiasi d + 1 K i s contiene almeno n - k ( d + 1 ) > 0 punti. Per il teorema di Helly (dal semispazi sono convessi), v'è un punto nell'intersezione di tutti i K i s . Lasciamo che f sia una funzione che calcola un punto arbitrario nell'intersezione di K i .Kikd+1 Kink(d+1)KisfKi

Tutti i residui che è di mostrare che l'intersezione del s è contenuto in G .KiG

Senza perdita di generalità, è lo scafo convesso di un sottoinsieme dei punti a pieno titolo. Cioè, possiamo sostituire G con lo scafo convesso dei punti che contiene. Se questo non ha un rango completo, possiamo semplicemente applicare il nostro teorema nella dimensione inferiore.GG

Ogni faccia di definisce un semispazio, dove G è l'intersezione di questi semispazi. Ognuno di questi semispazi contiene G e quindi contiene almeno n - k punti. Il confine di uno di questi semispazi contiene una faccia di G e quindi contiene una serie di punti di rango massimo. Quindi ciascuno di questi semispazi è una K i . Pertanto l'intersezione di tutti i K è contenuta in G , come richiesto.GGGnkGKiKiG

Per calcolare , impostare un programma lineare in cui i vincoli lineari corrispondono a K i e una soluzione fattibile corrisponde a un punto nell'intersezione di tutti i K i . QEDfKiKi

Sfortunatamente, questo risultato non è molto pratico nel contesto ad alta dimensione. Una buona domanda è se possiamo calcolare più efficiente:f

Apri problema. Dimostrare il teorema sopra con la conclusione aggiuntiva che può essere calcolato nel polinomio temporale in n e d . fnd

A parte: possiamo anche cambiare il problema per ottenere una soluzione efficiente: se hanno la proprietà che rigorosamente più della metà si trova in una palla B ( y , ε ) , allora possiamo trovare un punto z che sta in B ( y , 3 ε ) nel tempo polinomiale in n e d . In particolare, possiamo impostare z = x i per un i arbitrario tale che rigorosamente più della metà dei punti sono in Bx1,,xnB(y,ε)zB(y,3ε)ndz=xii .B(z,2ε)


Penso che tu abbia sostanzialmente reinventato la profondità di Tukey come David Eppstein delinea di seguito :)
Suresh Venkat

7

C'è una nozione della mediana di un insieme di punti in dimensioni elevate e norme generali che è noto sotto vari nomi. È solo il punto che minimizza la somma delle distanze da tutti i punti dell'insieme. È noto per avere una proprietà di amplificazione della confidenza simile alla solita mediana con un piccolo aumento moltiplicativo della distanza. Puoi trovare i dettagli nel Teorema 3.1 di questo documento: http://arxiv.org/pdf/1308.1334.pdf

Una cosa bella che questo documento mostra è che il fattore con cui la distanza aumenta può essere reso qualsiasi costante> 1 se puoi amplificare da una fiducia arbitrariamente alta (ma costante <1).

Modifica: c'è un altro recente articolo sull'argomento di Hsu e Sabato http://arxiv.org/pdf/1307.1827v6.pdf Analizza principalmente e applica la procedura in cui il punto nel set con la minima distanza mediana dal resto dei punti viene utilizzato. Questa procedura può essere utilizzata con qualsiasi metrica ma fornisce solo un fattore di approssimazione di 3.


Grazie, sembra carino! L'ho scremato solo finora, ma (a meno che non mi sbagli o ci salti troppo in fretta), si occupa del caso specifico in cui è una p -ball; è corretto? Sp
Clemente C.,

1
Non proprio. Il risultato è indicato per tutti gli spazi Banach. Per ogni corpo che è centrato sull'origine e simmetrico attorno al suo centro c'è una norma corrispondente in cui questo corpo è la palla unitaria. Poiché ai fini della tua domanda possiamo supporre senza perdita di generalità che il corpo convesso è centrato sull'origine, otteniamo risultati per ogni corpo convesso simmetrico centralmente. Forse con un leggero sforzo il risultato può essere esteso a corpi convessi generali.
Vitaly,

1
Devi conoscere la norma per calcolare il minimizzatore per quella norma, però - se sai solo che esiste una norma ma non quello che è, sei sfortunato.
David Eppstein,

1
Hai ragione, David. Devi conoscere la norma. (Questo si traduce nella conoscenza del corpo convesso fino al centro e nel ridimensionamento).
Vitaly,

Stavo pensando a questo approccio, ma poi ho pensato a questo controesempio per insiemi convessi arbitrari. Come si gioca a questi risultati? Sia distribuito nel piano come segue: con probabilità 0,9 , uniforme su ( - 1 , 0 ) e ( + 1 , 0 ) , con probabilità 0,1 , uguale a ( 0 , 0,0001 ) . Il set "buono" convesso è la linea da ( - 1 , 0 ) a ( 1 , 0 )X0.9(1,0)(+1,0)0.1(0,0.0001)(1,0)(1,0). Ma se prendiamo molti campioni, la mediana generalizzata sarà uno dei punti campionati situati a . Generalizza questo facilmente a quote superiori usando un iperpiano e un punto leggermente sfalsato. (0,0.0001)
usul
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.