Come si fa a sapere quale notazione dell'analisi della complessità del tempo usare?

Nella maggior parte delle lezioni introduttive sugli algoritmi, vengono introdotte notazioni come $O$ (Big O) e $\Theta$ , e uno studente in genere imparerebbe ad usare una di queste per trovare la complessità temporale.

Tuttavia, ci sono altre notazioni, come $o$ , $\Omega$ e $\omega$ . Esistono scenari specifici in cui una notazione sarebbe preferibile a un'altra?

— Jack H.
fonte

non è tanto preferibile quanto applicabile ...

— vzn

Risposte:

Ti riferisci alla notazione Landau . Non sono simboli diversi per la stessa cosa ma hanno significati completamente diversi. Quale è "preferibile" dipende interamente dall'affermazione desiderata.

significa che cresce al più velocemente di , asintoticamente e fino a un fattore costante; pensalo come un . è la forma più rigorosa, cioè . $f \in \cal{O}(g)$ $f$ $g$ $\leq$ $f \in o(g)$ $<$

ha il significato simmetrico:cresce almeno quanto. è suo cugino più severo. Puoi vedere cheè equivalente a. $f \in \Omega(g)$ $f$ $g$ $\omega$ $f \in \Omega(g)$ $g \in \cal{O}(f)$

$f \in \Theta(g)$ significa che cresce circa quanto ; formalmente . (uguaglianza asintotica) è la sua forma più forte. Spesso intendiamo quando usiamo . $f$ $g$ $f \in \cal{O}(g) \cap \Omega(g)$ $f \sim g$ $\Theta$ $\cal{O}$

Nota come e i suoi fratelli sono classi di funzioni . È importante essere molto consapevoli di questo e delle loro definizioni precise - che possono differire a seconda di chi sta parlando - quando si fa "aritmetica" con loro. $\cal{O}(g)$

Quando provi le cose, abbi cura di lavorare con la tua definizione precisa. Ci sono molte definizioni per i simboli Landau in giro (tutte con la stessa intuizione di base), alcune delle quali sono equivalenti su alcuni insiemi di funzioni ma non su altri.

Letture consigliate:

Se sei interessato a usare la notazione Landau in modo rigoroso e solido, potresti essere interessato ai recenti lavori di Rutanen et al. [1]. Formulano criteri necessari e sufficienti per la notazione asintotica quando li usiamo in algoritmi, mostrano che la definizione comune non riesce a soddisfarli e forniscono una definizione (in effetti) praticabile.

Una definizione generale della notazione O per l'analisi dell'algoritmo di K. Rutanen et al. (2015)

— Raffaello
fonte

Voglio solo sottolineare che sebbene

agisca come

, ci sono differenze; non è difficile trovare le funzioni

tale che

O

$\mathcal{O}$

\leq

$\le$

Ω

$\Omega$

\geq

$\ge$

g

$g$

f

$f$

f \notin O (g)

$f \not\in \mathcal{O}(g)$

f \notin Ω (g)

$f \not\in \Omega(g)$

— Zach Langley

+1 per la menzione delle classi di funzioni. Cose come

appaiono ovunque in documenti e libri, il che può essere fonte di confusione per le persone che affrontano queste notazioni per la prima volta.

o (1)

$o(1)$

Ω (2^{n})

$\Omega(2^n)$

— Janoma

@ZachLangley Quello che dici è molto vero. Non esiste un ordine totale qui. Probabilmente è pericoloso far apparire

affatto, ma penso che serva allo scopo della costruzione dell'intuizione.

\leq

$\leq$

— Raffaello

Big O: limite superiore

"Big O" ( ) è di gran lunga il più comune. Quando si analizza la complessità di un algoritmo, la maggior parte delle volte, ciò che conta è avere un limite superiore alla velocità con cui il tempo di esecuzione¹ aumenta quando aumenta la dimensione dell'input. Fondamentalmente vogliamo sapere che l'esecuzione dell'algoritmo non richiederà "troppo tempo". Non possiamo esprimerlo in unità di tempo effettive (secondi), perché ciò dipenderebbe dall'implementazione precisa (il modo in cui è scritto il programma, quanto è buono il compilatore, quanto è veloce il processore della macchina, ...). Quindi valutiamo ciò che non dipende da tali dettagli, ovvero quanto tempo ci vuole per eseguire l'algoritmo quando gli forniamo input più grandi. E ci preoccupiamo soprattutto quando possiamo essere sicuri che il programma sia stato completato, quindi di solito vogliamo sapere che ci vorrà un tale tempo o meno. $O$

Dire che un algoritmo ha un tempo di esecuzione di per una dimensione di input significa che esiste una costante tale che l'algoritmo completa al massimo $O(f(n))$ $n$ $K$ passi, ovvero il tempo di esecuzione dell'algoritmo cresce al più velocemente di (fino a un fattore di ridimensionamento). Notando il tempo di esecuzione dell'algoritmo per la dimensione di input , significa informalmente che fino ad un fattore di ridimensionamento. $K \, f(n)$ $f$ $T(n)$ $n$ $O(n)$ $T(n) \le f(n)$

Limite inferiore

A volte, è utile avere più informazioni di un limite superiore. è il contrario di : esprime che una funzione cresce almeno altrettanto velocemente di un'altra. significa che per una costante , o per dirla in modo informale, fino ad un certo ridimensionamento fattore. $\Omega$ $O$ $T(n) = \Omega(g(n))$ $T(N) \ge K' g(n)$ $K'$ $T(n) \ge g(n)$

Quando il tempo di esecuzione dell'algoritmo può essere determinato con precisione, combina e : esprime che è noto il tasso di crescita di una funzione, fino a un fattore di ridimensionamento. significa che per alcune costanti e . Informalmente parlando, $\Theta$ $O$ $\Omega$ $T(n) = \Theta(h(n))$ $K h(n) \ge T(n) \ge K' h(n)$ $K$ $K'$ fino ad un certo fattore di scala. $T(n) \approx h(n)$

Ulteriori considerazioni

I "piccoli" e sono usati molto meno spesso nell'analisi della complessità. La piccola è più forte della grande ; dove indica una crescita che non è più veloce, indica che la crescita è strettamente più lenta. Al contrario, indica una crescita strettamente più rapida. $o$ $\omega$ $o$ $O$ $O$ $o$ $\omega$

Sono stato leggermente informale nella discussione sopra. Wikipedia ha tutte le definizioni e un approccio più matematico.

Tieni presente che l'uso del segno uguale in e simili è un termine improprio. A rigor di termini, è un insieme di funzioni della variabile , e dovremmo scrivere . $T(n) = O(f(n))$ $O(f(n))$ $n$ $T \in O(f)$

Esempio: alcuni algoritmi di ordinamento

Dato che è piuttosto secco, lasciami fare un esempio. La maggior parte degli algoritmi di ordinamento ha un tempo di esecuzione quadratico nel caso peggiore, ovvero per un input di dimensione , il tempo di esecuzione dell'algoritmo è . Ad esempio, l' ordinamento di selezione ha un tempo di esecuzione , poiché la selezione dell'elemento th richiede confronti , per un totale di confronti. In effetti, il numero di confronti è sempre esattamente $n$ $O(n^2)$ $O(n^2)$ $k$ $n-k$ $n(n-1)/2$ , che cresce come . Quindi possiamo essere più precisi sulla complessità temporale dell'ordinamento per selezione: è . $n(n-1)/2$ $n^2$ $\Theta(n^2)$

Ora prendi il tipo di unione . Unisci ordinamento è anche quadratico ( ). Questo è vero, ma non molto preciso. Unisci ordinamento infatti ha un tempo di esecuzione di $O(n^2)$ nel peggiore dei casi. Come per l'ordinamento di selezione, il flusso di lavoro dell'ordinamento di unione è essenzialmente indipendente dalla forma dell'input e il suo tempo di esecuzione è sempre $O(n \: \mathrm{lg}(n))$ fino a un fattore moltiplicativo costante, cioè è $n \: \mathrm{lg}(n)$ . $\Theta(n \: \mathrm{lg}(n))$

Quindi, considera quicksort . Quicksort è più complesso. È certamente . Inoltre, il caso peggiore di quicksort è quadratico: il caso peggiore è . Tuttavia, il caso migliore di quicksort (quando l'ingresso è già ordinato) è lineare: il migliore che possiamo dire per un limite inferiore a quicksort in generale è . Non ripeterò qui la prova, ma la complessità media di quicksort (la media rilevata su tutte le possibili permutazioni dell'input) è $O(n^2)$ $\Theta(n^2)$ $\Omega(n)$ . $\Theta(n \: \mathrm{lg}(n))$

Ci sono risultati generali sulla complessità degli algoritmi di ordinamento in impostazioni comuni. Supponiamo che un algoritmo di ordinamento possa confrontare solo due elementi alla volta, con un risultato sì o no (o oppure ). Quindi è ovvio che il tempo di esecuzione di qualsiasi algoritmo di ordinamento è sempre (dove è il numero di elementi da ordinare), perché l'algoritmo deve confrontare ogni elemento almeno una volta per sapere dove si adatterà. Questo limite inferiore può essere soddisfatto, ad esempio, se l'input è già ordinato e l'algoritmo confronta semplicemente ciascun elemento con quello successivo e li mantiene in ordine (ovvero $x \le y$ $x > y$ $\Omega(n)$ $n$ $n-1$ i confronti). Ciò che è meno ovvio è che il tempo di funzionamento massimo è necessariamente . È possibile che l'algoritmo a volte comporti un numero inferiore di confronti, ma deve esserci una costante tale che per qualsiasi dimensione di input , vi sia almeno un input su cui l'algoritmo effettua più di confronti. L'idea della dimostrazione è costruire l'albero decisionale dell'algoritmo, cioè seguire le decisioni che l'algoritmo prende dal risultato di ogni confronto. Poiché ogni confronto restituisce un risultato sì o no, l'albero decisionale è un albero binario. Ci sono $\Omega(n \: \mathrm{lg}(n))$ $K$ $n$ $K n \mathrm{lg}(n)$ $n!$ possibili permutazioni dell'input e l'algoritmo deve distinguere tra tutti loro, quindi la dimensione dell'albero decisionale è . Poiché l'albero è un albero binario, richiede una profondità di $n!$ per adattarsi a tutti questi nodi. La profondità è il numero massimo di decisioni che l'algoritmo prende, quindi l'esecuzione dell'algoritmo comporta almeno questo numero di confronti: il tempo di esecuzione massimo è $\Theta(\mathrm{lg}(n!)) = \Theta(n\:\mathrm{lg}(n))$ . $\Omega(n \: \mathrm{lg}(n))$

¹ _{O altro consumo di risorse come spazio di memoria. In questa risposta, prendo in considerazione solo il tempo di esecuzione.}

— Gilles
fonte

"Tuttavia, il caso migliore di quicksort (quando l'ingresso è già ordinato) è lineare" questo è il caso peggiore !!

— user5507

@ user5507: in realtà dipende dalla strategia pivot. Se il primo (o l'ultimo) elemento è scelto come perno, allora hai ragione; ma se scegli l'elemento centrale o la mediana del primo, medio, ultimo, l'input ordinato è il caso migliore.

— Chirlu,

"I piccoli o e ω sono usati molto meno spesso nell'analisi della complessità." Questo non è vero nell'analisi della complessità dello spazio. Nell'analisi della complessità temporale, in genere si utilizzano o e ω quando si contano operazioni specifiche (confronti, ricerche su disco, errori nella cache, cosa si ha). Ma dato che puoi sempre aspettare e acquistare un computer più veloce, il "tempo della parete" è sempre "fino a un fattore costante", quindi big-O è molto più comune. Nell'analisi dello spazio, ci sono spesso limiti inferiori rigidi a causa della teoria dell'informazione, quindi è estremamente comune vedere dimensioni riportate come "f (n) + o (f (n)) bit" dove f (n) è il limite inferiore.

— Pseudonimo del

Mentre ci penso: se f (n) è un limite inferiore teorico alla dimensione di una struttura di dati, uno che usa f (n) + O (1) (overhead costante) è chiamato "implicito", uno che usa f (n) + O (f (n)) (overhead relativo costante) è chiamato "compatto", e uno che usa f (n) + o (f (n)) (l'overhead relativo diventa infine insignificante) è chiamato "succinto ". Buoni termini per sapere se hai mai bisogno di lavorare in quello spazio.

— Pseudonimo del

In genere viene utilizzato per indicare i limiti superiori (una stima dall'alto), mentre viene utilizzato per indicare i limiti inferiori (una stima dal basso) e viene utilizzato quando corrispondono, nel qual caso è possibile utilizzare al posto di loro (di solito) per dichiarare il risultato. $O$ $\Omega$ $\Theta$ $\Theta$

— Kaveh
fonte

"Tipicamente"? Possono essere usati per qualcos'altro?

— svick

@svick, sì, ad es.

che non è un'istruzione con limite superiore. Con un'istruzione di limite superiore intendo qualcosa di simile a

che esprime un limite superiore su

P = D T i m e (n^{O (1)})

$\mathsf{P} = \mathsf{DTime}(n^{O(1)})$

f = O (g)

$f = O(g)$

f

$f$

— Kaveh

In realtà, Kaveh, questa è un'affermazione superiore. La traduzione inglese propoer di "

" è "P è l'insieme di problemi che possono essere risolti utilizzando AT MOST un numero polinomiale di operazioni". Se non volevi dire "al massimo", avresti dovuto scrivere

. (Entrambe le affermazioni sono corrette, ovviamente.)

P = D T i m e (n^{O (1)})

$P = DTime(n^{O(1)})$

P = D T i m e (n^{Θ (1)})

$P = DTime(n^{\Theta(1)})$

— JeffE l'

@JeffE, la considero un'uguaglianza tra insiemi di funzioni, ma hai ragione, puoi anche pensarla come un limite superiore in un senso più generale.

— Kaveh

@JeffE In realtà,

, poiché

P \neq D T I M E (n^{Θ (1)})

$\mathrm{P}\neq \mathrm{DTIME}(n^{\Theta(1)})$

D T I M E (Θ (n \log n)) \subset P

$\mathrm{DTIME}(\Theta(n\log n))\subset \mathrm{P}$

D T I M E (Θ (n \log n)) \cap D T I M E (n^{Θ (1)}) = \emptyset

$\mathrm{DTIME}(\Theta(n\log n))\cap\mathrm{DTIME}(n^{\Theta(1)})=\emptyset$

— David Richerby,