Ordinamento con una media di

Esiste un algoritmo di ordinamento confronto-based che utilizza una media di confronti? $\mathrm{lg}(n!)+o(n)$

Esistenza di un caso peggiore algoritmo di confronto è un problema aperto, ma i suffissi caso medio per un algoritmo randomizzato con previsto confronti per ogni ingresso . Il significato di è che è confronti dall'ottimale, sprecando una media di solo $\mathrm{lg}(n!)+o(n)$ $\mathrm{lg}(n!)+o(n)$ $\mathrm{lg}(n!)+o(n)$ $o(n)$ confronti per elemento. $o(1)$

Dal momento che ho già un tale algoritmo, lo sto includendo come risposta (usando il formato Q / A ), ma accolgo con favore ulteriori risposte, inclusi altri algoritmi, se tale algoritmo fosse già noto, migliorando e peggio- case . $o(n)$ $\mathrm{lg}(n!)+o(n)$

Lavoro precedente:
Unisci ordinamento utilizza confronti (anche nel caso peggiore). Merge-inserzione (noto anche come Ford-Johnson sort) utilizza anche confronti ma con una costante molto più piccolo in . Miglioramento della complessità media per l'ordinamento basato sul confronto (di Kazuo Iwama e Junichi Teruyama) - il loro algoritmo di inserimento (1,2) ricorda una parte della mia risposta di seguito. $\mathrm{lg}(n!)+ Θ(n)$
$\mathrm{lg}(n!)+ Θ(n)$ $Θ(n)$

cc.complexity-theory ds.algorithms sorting

— Dmytro Taranovsky
fonte

Questa domanda si sovrappone all'ordinamento del confronto randomizzato ottimale , ma data la diversa enfasi (comportamento asintotico specifico qui - rispetto allo stato generale di conoscenza, tutte le dimensioni di input e la differenza dal caso peggiore lì), ho deciso di usare una nuova domanda.

— Dmytro Taranovsky,

Aggiornamento: Ho ampliato questa risposta in un documento ordinamento con una media di confronti $\mathrm{lg}(n!)+o(n)$ .

Sì, esiste un tale algoritmo. Dimostrerò solo legato, ma in base a una presunta ipotesi di randomizzazione otteniamo anche . Descriverò anche un tentativo per e . $\mathrm{lg}(n!)+o(n)$ $\mathrm{lg}(n!)+O(n^{1-ε})$ $n^{0.5+o(1)}$ $O(n^{0.5-ε})$

Possiamo presumere che tutti gli elementi siano distinti, annotandoli se necessario; il caso medio utilizza elementi distinti in ordine casuale. Possiamo calcolare il numero medio di confronti aggiungendo la perdita di entropia per ciascun confronto rispetto all'uso di una moneta equa.

Il punto di partenza è insertion sort con una ricerca binaria per decidere dove inserire l'elemento successivo nella ordinata sottoinsieme . Quando , un inserimento utilizza al massimo confronti, che (in termini di entropia) è ottimale fino a un fattore additivo (e per la complessità del caso medio, $S$ $(1-ε)2^m ≤ |S| ≤ 2^m-1$ $m$ $O(ε)$ $2^m ≤ |S| ≤ (1+ε) 2^m$ funziona anche). Ora, quando non è vicino a una potenza di 2, l'inserimento di un elemento non è ottimale (anche nel caso medio e indipendentemente da come bilanciamo ogni query), ma se si sprecano confronti, si potrebbe indirizzare a una distribuzione approssimativamente uniforme su un intervallo di di lunghezza vicino a una potenza di 2, otteniamo l'ottimalità desiderata. $|S|$ $A$ $o(1)$ $A$ $S$

Raggiungiamo questo obiettivo aggiungendo elementi in lotti e talvolta confrontando in modo efficiente elementi del lotto tra loro, in modo tale che l'intervallo di corrispondente a un elemento diminuisca in modo quasi casuale (e con la distribuzione di probabilità di all'interno dell'intervallo quasi uniforme), e quando la lunghezza dell'intervallo è abbastanza vicino a una potenza di 2, facendo la ricerca binaria per inserire . $S$ $A$ $A$ $A$

Costrutti comuni

Manterremo un sottoinsieme di elementi ordinati, e per ciascun elemento indifferenziati , terremo traccia del minimo dell'intervallo di dove è noto per essere collocata. è la lunghezza di ; è in base all'identità degli intervalli. $S$ $A$ $I_A$ $S$ $A$ $|I_A|$ $I_A$ $I_A=I_B$

Sia essere: confronta con , quindi (in ordine casuale) confronta e con gli elementi corrispondenti di fino a quando i loro intervalli sono disgiunti (o hanno lunghezza 1). L'elemento di è scelto (in modo coerente) per rendere le probabilità per il confronto più vicino a 1/2 come possibile, presumendo che quando viene chiamato, $\mathrm{Compare}(A,B)$ $A$ $B$ $A$ $B$ $S$ $S$ $\mathrm{Compare}$ $(A,B)$ è distribuita uniformemente su . A causa della disgiunzione alla fine, preserva l'assunzione uniformità. $I_A⨯I_B$ $\mathrm{Compare}$

Le seguenti sezioni possono essere lette indipendentemente l'una dall'altra.

A algoritmo $\mathrm{lg}(n!)+o(n)$

Dato: un elenco ordinato e un batch di elementi non ordinati; ; gli elementi indifferenziati sono relative casuale . $S$ $m$ $m∈ω(1)∩o(|S|)$ $S$

Ripeti (1) - (3) quando possibile:
1. Scegli due elementi e dal lotto con (qualsiasi scelta funzionerà). 2. Eseguire . 3. Se è abbastanza vicino a una potenza di 2, ^{(nota 1)} rimuovere dal lotto (senza dimenticare ); e fare in modo simile con . Infine: inserisci tutti gli elementi in $A$ $B$ $I_A=I_B$
$\mathrm{Compare}(A,B)$
$|I_A|$ $A$ $I_A$ $B$
e completa l'ordinamento. $S$

Nota 1: per "abbastanza vicino", qualsiasi errore relativo (in funzione di ) funziona fintanto che gli elementi saranno rimossi nel passaggio (4) (possibile con la nota 2). In base a un'ipotesi di randomizzazione congetturata, l'uso di errore relativo acquisisce elementi, consentendo a $o(1)$ $m$ $m-o(m)$ $c \log \log m / \log m$ $m(1-\log^{-Θ(c)}m)$ algoritmo di ordinamento comparativo medio. $\mathrm{lg}(n!)+O(n \log \log n / \log n)$

Nota 2: poiché la stessa sequenza di confronti porta allo stesso intervallo di delimitazione, quasi tutti gli elementi passeranno attraverso i passaggi (1) volte (a meno che non vengano rimossi nel passaggio 4). All'inizio, se e scegliamo , confrontiamo con l'elemento $Ω(\log m)$ $A < B$ $A$ $A$ e ogni applicazione del passaggio da (3) adhaprobabilitàdi ridurrein $S[≈(1-1/\sqrt{2})|S|]$ $A$ $O(1)$ $|I_A|$ volte. Ora per ogni rapportoche non è un potere razionale di 2, abbiamo $≈1/(1-1/\sqrt{2})$ $a>1$ , e quindi otteniamo illimite. $∀ε>0 ∀d>0 ∃m,n∈\mathbb{N} \,\, 1-ε < \frac{a^m}{d2^n} < 1+ε$ $o(n)$

Un probabile algoritmo $\mathrm{lg}(n!)+O(n^{1-ε})$

Modulo un'ipotesi di randomizzazione, possiamo ottenere i confronti medi come segue. $\mathrm{lg}(n!)+O(n^{1-ε})$

Mescola casualmente gli oggetti e ordina la prima metà in un elenco , mantenendo la seconda metà come batch non ordinato. $S$
$A∈\text{batch}$ $G = \{ B∈\text{batch}: |P(A < B) - 0.5| < n^{-0.51ε} \}$ $G$ $A$ $S$
1. $B∈G$ $Θ(1)$ $\mathrm{Compare}(A,B)$ $|I_A|$ $n^{-ε}$ $\mathrm{Compare}(A,B)$ $|I_A|$ $n^{-ε}$ $A$ $S$
2. $B∈G$ $\mathrm{Compare}(A,B)$ $B∈G$

$A$ $n^{Θ(1)}$ $n^{Θ(1)}$ $Θ(\log n)$ $ε$ $\mathrm{lg}(n!)+O(n^{1-ε})$ $A$ $B$

$\mathrm{Compare}(A,B)$ $ε≈(1-ε)/4/\log_{4/3} 2 ≈ 0.09$

Un approccio forse molto migliore è attendere fino a quando un intervallo è vicino a una potenza di 2, controllando non le singole lunghezze dell'intervallo ma le distribuzioni delle lunghezze.

$\mathrm{lg}(n!)+n^{0.5+o(1)}$

$|S|=n$ $n$ $I_A$ $|I_A|$ $n^{1-o(1)}$ $\frac{|I_A|}{2^{\lfloor \mathrm{lg} |I_A| \rfloor}}$ $A < S[i]$ $n^{0.5+o(1)}$
$\frac{|I_A|}{2^{\lfloor \mathrm{lg} |I_A| \rfloor}}$

$S$

$\frac{|I_A|}{2^{\lfloor \mathrm{lg} |I_A| \rfloor}}$ $|I_A|/2^{\lfloor \mathrm{lg} |I_A| \rfloor}$ $\frac{|I_A|}{2^{\lfloor \mathrm{lg} |I_A| \rfloor}}$

$\mathrm{Compare}(A,B)$ $P(A < B)≈0.5$ $I_A$ $I_A$ $\mathrm{Compare}$ $k=ω(1)$ $k=ω(1)$ $k$ $S$ $O(\log_k n + \log k)$ $k$ $Θ(\log k)$ $k$

$1/2+n^{-0.5}$ $O(1/n)$ $n^{o(1)}$ $n^{0.5+o(1)}$

$\mathrm{lg}(n!)+O(n^{0.5-ε})$ $|S|+n^{0.5+ε}$ $≈n^{0.5+ε}$ $≈n^{0.5+ε}$ $n^{0.5-ε/2+o(1)}$ $S$ $n^ε$ $I_A$ $Θ(n^{ε/2})$ $n^{1-o(1)}$ $n^{ε/2-o(1)}$ $\mathrm{lg}(n!)+O(n^{1-ε})$ $O(n^{0.5-ε'})$ $ε$

$\mathrm{lg}(n!)+o(n)$ $1.5n+o(n)$ $(2+ε)n-O(1)$

— Dmytro Taranovsky
fonte

Penso che dovresti scrivere questo come un documento.

— Emil Jeřábek,

@ EmilJeřábek Concordato. Come sito a livello di ricerca, molte domande e risposte qui sono mini-documenti, ma con la lunghezza e l'importanza qui, è desiderabile un documento formale. Sentiti libero di farmi sapere (a dmytro@mit.edu) su quali parti dovrebbero essere espanse nel documento (con questa risposta che rimane come una versione concisa).

— Dmytro Taranovsky,