Concentrazione nitida per la selezione tramite partizionamento casuale?


11

Il solito algoritmo semplice per trovare l'elemento mediano in una matrice di numeri è:An

  • Campione di elementi da con sostituzione inn3/4AB
  • Ordina e trovare il rango elementi e diB|B|±nlrB
  • Verificare che ed sono su lati opposti del mediano e che ci sono al massimo elementi in tra ed per una costante appropriata . Fallire se ciò non accade.lrACnAlrC>0
  • Altrimenti, trova la mediana ordinando gli elementi di tra eAlr

Non è difficile vedere che questo funziona in tempo lineare e che ha successo con alta probabilità. (Tutti i cattivi eventi sono grandi deviazioni dall'aspettativa di un binomio.)

Un algoritmo alternativo per lo stesso problema, che è più naturale insegnare agli studenti che hanno visto l'ordinamento rapido, è quello descritto qui: Selezione casuale

È anche facile vedere che questo ha un tempo di esecuzione previsto lineare: supponiamo che un "round" sia una sequenza di chiamate ricorsive che termina quando si dà una divisione 1 / 4-3 / 4, quindi osservare che la lunghezza prevista di un round è al massimo 2. (Nel primo sorteggio di un round, la probabilità di ottenere una buona divisione è 1/2 e poi dopo effettivamente aumenta, poiché l'algoritmo è stato descritto in modo che la lunghezza del round sia dominata da una variabile geometrica casuale).

Quindi ora la domanda:

È possibile dimostrare che la selezione randomizzata viene eseguita in tempo lineare con alta probabilità?

Abbiamo round e ogni round ha lunghezza almeno con probabilità al massimo , quindi un limite di unione indica che il tempo di esecuzione è con probabilità .O(logn)k2k+1O(nloglogn)11/O(logn)

Questo è un po 'insoddisfacente, ma in realtà è la verità?


Si prega di chiarire a quale algoritmo si riferiscono le vostre domande.
Raffaello

Stai chiedendo se hai applicato correttamente il tuo sindacato o se esiste un limite migliore e più soddisfacente?
Joe,

@Joe Quest'ultimo. Il punto è che i round sono un artefatto per ottenere che la lunghezza del round sia dominata da un geometrico. Quindi l'anaylisys "dimentica" se l'algoritmo è avanti o dietro quello che ottiene sempre una divisione 1 / 4-3 / 4 sul naso per rendere indipendenti le geometrie. Sto chiedendo se questo "imbroglione", come ha detto Yuval, è ancora stretto.
Louis,

Risposte:


5

Non è vero che l'algoritmo viene eseguito in tempo lineare con alta probabilità. Considerando solo il primo round, il tempo di esecuzione è almeno volte una variabile casuale . Sia la probabilità di fallimento consentita. Poiché , il tempo di esecuzione è almeno .Θ(n)G(1/2)p(n)0Pr[G(1/2)log2p(n)1]=p(n)Ω(nlog2p(n)1)=ω(n)

(Ci sono alcuni imbrogli, dato che la lunghezza del primo round non è proprio . Un'analisi più attenta potrebbe o meno confermare questa risposta.)G(1/2)

Modifica: Grübel e Rosler hanno dimostrato che il numero atteso di confronti diviso per tende (in un certo senso) ad una certa distribuzione limite, che è illimitata. Vedi ad esempio l'articolo di Grübel "L'algoritmo di selezione di Hoare: un approccio a catena di Markov", che fa riferimento al loro documento originale.n


Ecco la cosa che mi disturba. Come ho detto nel mio commento sopra, i round sono solo un modo per analizzare una versione "rallentata" dell'algoritmo che attende fino a quando non ottiene un perno abbastanza buono per procedere. Quello che stai mostrando è che per ogni fisso la probabilità che il primo round abbia bisogno di più dei perni è . Ma, in linea di principio, un primo primo round potrebbe essere compensato da un secondo round vuoto, nel senso che alla fine l'algoritmo "non rallentato" ha raggiunto quello che ottiene sempre una divisione 1 / 4-3 / 4 . C>0C>0
Louis,

1
Questo non è vero, se il primo round è lungo, l'intero tempo di esecuzione è lungo, poiché ulteriori round non possono ridurre il tempo di esecuzione. Il punto è che per ogni , il primo round richiede tempo almeno con qualche probabilità costante . CCnpC>0
Yuval Filmus,

Sono più felice ora, poiché la lunghezza rotonda non è molto più piccola della geometria utilizzata per il limite superiore. Immagino che questo sia ciò che G&R sta diventando severo. Bella risposta.
Louis,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.