Come dici tu, il teorema di Akra – Bazzi mostra che la soluzione alla ricorrenza è per tutti i . Tuttavia, ciò non rivela la natura della dipendenza da . Per determinare quest'ultimo, possiamo usare un approccio ad albero di ricorsione.O ( n log n ) p ∈ ( 0 , 1 ) pT(n,p)O(nlogn)p∈(0,1)p
Alla radice dell'albero di ricorsione si trova l'intervallo . I suoi due figli sono gli intervalli e , la cui lunghezza totale è di nuovo . Ognuno di questi nodi ha due figli (supponendo che sia abbastanza grande) e così via. Per semplicità ignoriamo gli errori di arrotondamento, ovvero supponiamo che sia un numero intero; questo è solo un tecnicismo e non me ne preoccuperei. Interrompiamo il processo ogni volta che un nodo ha una lunghezza al massimo . La complessità dell'algoritmo è proporzionale alla lunghezza totale degli intervalli nella struttura. Quando , le foglie{ 1 , ... , p n } { p n + 1 , ... , n } n n p n 1 p ≠ 1 / 2{1,…n}{1,…,pn}{pn+1,…,n}nnpn1p≠1/2 (nodi in cui interrompiamo il processo) hanno profondità diverse e ciò rende più difficile determinare la complessità complessiva.
Possiamo ottenere un semplice limite superiore notando che l'albero ha al massimo livelli : ogni nodo è almeno un fattore più piccolo del suo genitore. Proprio come nell'analisi per , la lunghezza totale degli intervalli a qualsiasi livello è al massimo , e otteniamo un limite superiore di sul tempo di esecuzione. Poiché e per piccola , possiamo scrivere questo come .1 - p p = 1 / 2 n O ( n log 1 - p ( 1 / n ) ) log 1 - p ( 1 / n ) = log n / log ( 1 - p ) - 1 registro ( 1 - p ) - 1log1−p(1/n)1−pp=1/2nO(nlog1−p(1/n))log1−p(1/n)=logn/log(1−p)−1p O ( n log n / p )log(1−p)−1=−log(1−p)=p±O(p2)pO(nlogn/p)
Ecco un calcolo più accurato. Considera il livello . Supponiamo di non interrompere il processo al raggiungimento di un piccolo intervallo. Possiamo generare un vertice casuale prendendo passi, in ognuno dei quali andiamo a sinistra (diciamo) con probabilità e a destra (diciamo) con probabilità . Ogni volta che facciamo un passo a sinistra il registro della lunghezza dell'intervallo diminuisce di , e ogni volta che facciamo un passo a destra diminuisce di . Un vertice si trova nell'albero reale del registro della lunghezza diminuita al massimo . Il peso totale degli intervalli al livellotp 1 - p - log p - log ( 1 - p ) log n t log n D - log p p - log ( 1 - p ) 1 - p X 1 , … , X t ∼ D t Pr [ X 1 + ⋯ + X t ≤ log n ] ttp1−p−logp−log(1−p)logntdell'albero è esattamente la probabilità che un vertice generato secondo questo processo corrisponda ad una diminuzione al massimo . Cioè, se è la distribuzione che è uguale a con probabilità e a con probabilità e sono indipendenti, quindi il il peso totale del livello è . Per super costante , la variabile casuale è approssimativamente normalmente distribuita con media varianza lineare inlognD−logpp−log(1−p)1−pX1,…,Xt∼DtPr[X1+⋯+Xt≤logn]t [ - p log p - ( 1 - p ) log ( 1 - p ) ] t t t [ - p log p - ( 1 - p ) log ( 1 - p ) ] t ≤ ( log n ) / 2 1 t [ - p logX1+⋯+Xt[−plogp−(1−p)log(1−p)]tt, quindi per soddisfacente , diciamo, la probabilità sarà molto vicina a , mentre per soddisfacente , diciamo, sarà molto vicino allo zero. Definendo (nota come funzione di entropia binaria), concludiamo che il tempo di esecuzione è (uniforme in , come da ). Come abbiamo , e quindi la nostra stima precedente non era stretta.t[−plogp−(1−p)log(1−p)]t≤(logn)/21th ( p ) = - p log p - ( 1 - p ) log ( 1 - p ) Θ ( n log n / h ( p ) ) p n → ∞ p → 0 h ([−plogp−(1−p)log(1−p)]t≥2lognh(p)=−plogp−(1−p)log(1−p)Θ(nlogn/h(p))pn→∞p→0h(p)≈−plogp
Un altro modo di guardare la stessa analisi è avere una sequenza infinita di variabili casuali indipendenti come in precedenza e definire un tempo di arresto per essere la prima volta tale che . Il tempo di esecuzione è quindi proporzionale a . Il teorema di rinnovamento elementare afferma quindi che , sottintendendo che il la dimensione totale degli intervalli è uguale a . Più precisamente, per ogni costante la dimensione totale degli intervalli è , doveT t X 1 + ⋯ + X t ≥ log n n E [ T ] lim n → ∞ E [ T ] / log n = 1 / E [ D ] = 1 / h ( p ) ( 1 + o ( 1 ) ) n log nX1,X2,…TtX1+⋯+Xt≥lognnE[T]limn→∞E[T]/logn=1/E[D]=1/h(p)p ( 1 + α p ( n ) ) n log n / h ( p ) α p ( n ) = o ( n ) log n n α p ( n ) = O ( n - C p ) p ∈ ( δ , 1 - δ ) δ > 0(1+o(1))nlogn/h(p)p(1+αp(n))nlogn/h(p)αp(n)=o(n) . La convergenza nel teorema di rinnovo elementare è esponenziale nel parametro time - nel nostro caso - quindi dovrebbe essere polinomiale in , cioè . La convergenza è probabilmente anche uniforme per per qualsiasi .lognnαp(n)=O(n−Cp)p∈(δ,1−δ)δ>0
Riassumendo, la lunghezza totale degli intervalli nell'albero di ricorsione, che è proporzionale al tempo di esecuzione, è della seguente forma per ogni : dove e vengono portati sulla stessa base e è una funzione che dipende da e tende a con .T ( n , p ) = ( 1 + o ( 1 ) ) n log nplognh(p)=-plogp-(1-p)log(1-p)o(1)p0n
T(n,p)=(1+o(1))nlognh(p),
lognh(p)=−plogp−(1−p)log(1−p)o(1)p0n
Inoltre, è probabilmente vero che per qualsiasi e qualsiasi è vero che la lunghezza totale degli intervalli è della forma dove e la grande costante O nascosta dipendono solo da . In particolare, dovrebbe essere il caso che per tutte le costanti ,
e la convergenza è polinomialmente veloce.δ>0p∈(δ,1−δ)
T(n,p)=(1+O(n−Cδ))nlognh(p),
Cδ>0δp1,p2limn→∞T(n,p1)T(n,p2)=h(p2)h(p1),