Complessità di un algoritmo ingenuo per trovare la sottostringa di Fibonacci più lunga

Dati due simboli e , definiamo il -esimo stringa Fibonacci come segue: $\text{a}$ $\text{b}$ $k$

F (k) = {\begin{cases} b & if k = 0 \\ a & if k = 1 \\ F (k - 1) ⋆ F (k - 2) & else \end{cases}

$F(k) = \begin{cases} \text{b} &\mbox{if } k = 0 \\ \text{a} &\mbox{if } k = 1 \\ F(k-1) \star F(k-2) &\mbox{else} \end{cases}$

con indica la concatenazione di stringhe. $\star$

Quindi avremo:

$F(0) = \text{b}$
$F(1) = \text{a}$
$F(2) = F(1) \star F(0) = \text{ab}$
$F(3) = F(2) \star F(1) = \text{aba}$
$F(4) = F(3) \star F(2) = \text{abaab}$
...

Data una stringa formata da simboli, definiamo una sottostringa di Fibonacci come qualsiasi sottostringa di che è anche una stringa di Fibonacci per una scelta adatta di e . $S$ $n$ $S$ $\text{a}$ $\text{b}$

Il problema

Dato , vogliamo trovare la sua sottostringa Fibonacci più lunga. $S$

Un banale algoritmo

Per ogni posizione della stringa , supponiamo che inizi lì (è sufficiente verificare che simboli -th e -th siano distinti). In tal caso, controlla se può essere esteso a , quindi e così via. Successivamente, ricominciare dalla posizione . Ripetere fino a raggiungere la posizione . $i$ $S$ $F(2)$ $i$ $(i+1)$ $F(3)$ $F(4)$ $i+1$ $n$

Dobbiamo guardare ogni simbolo almeno una volta, quindi è . Ci sono solo due per i loop coinvolti, quindi possiamo anche dire che è . $\Omega(n)$ $O(n^2)$

Tuttavia (in qualche modo non sorprende) questo ingenuo algoritmo esegue molto meglio dei soliti algoritmi quadratici (se fa molto lavoro -esima posizione, non farà molto lavoro nelle posizioni successive). $i$

Come posso usare le proprietà di Fibonacci per trovare limiti più stretti per il tempo di esecuzione di questo algoritmo?

— wil93
fonte

Supponiamo che verifichi in qualche posizione se la sottostringa che inizia in quella posizione è compatibile con o con la sua complementazione. Quanto possono essere ravvicinate le occorrenze di ? Prendi come esempio . Se verifica nella posizione non può verificarsi nella posizione o $F(n)$ $F(n)$ $F(n)$ $F(4) = abaab$ $F(4)$ $p$ $p+1$ $p+2$ , ma può apparire nella posizione . Lasciamo che sia il numero più piccolo in modo tale che due occorrenze di possano verificarsi alla distanza di . Puoi indurre per induzione che per abbiamo (ad esempio, ). $p+3$ $\ell(n)$ $F(\ell)$ $\ell$ $n \geq 4$ $\ell(n) = |F(n-1)|$ $\ell(4) = 3$

Data una stringa di lunghezza , per ogni sia l'insieme delle posizioni in cui si verifica . Possiamo limitare il tempo di esecuzione della procedura approssimativamente di , in cui la somma si estende su tutto tale che (diciamo). Poiché occorrenze di $N$ $n$ $P(n)$ $F(n)$ $\sum_n |P(n)| |F(n)|$ $n$ $|F(n-1)| \leq N$ sono separati da almeno, vediamo che il tempo di esecuzione è limitato dall'ordine di $F(n)$ $|F(n-1)|$ Poiché la lunghezza delle parole di Fibonacci aumenta in modo esponenziale,. Il termine rimanente è, poiché la somma contiene ilmolti termini. Concludiamo che il tempo di esecuzione è

\sum_{n} | F (n) | (\frac{N}{| F (n - 1) |} + 1) .

$\sum_n |F(n)| \left(\frac{N}{|F(n-1)|} + 1\right).$

\sum_{n} | F (n) | = O (N)

$\sum_n |F(n)| = O(N)$

\sum_{n} O (N) = O (N \log N)

$\sum_n O(N) = O(N\log N)$

\log N

$\log N$

O (N \log N)

$O(N\log N)$

Al contrario, il tempo di esecuzione su è , come può essere dimostrato dall'induzione. Concludiamo che il tempo di esecuzione del caso peggiore su stringhe di lunghezza è . $F_n$ $\Omega(|F_n|\log|F_n|)$ $N$ $\Theta(N\log N)$

— Yuval Filmus
fonte