La prima cosa che viene in mente come qualcosa che potresti trovare affascinante è la complessità di Kolmogorov; Lo trovo sicuramente affascinante, e dato che non lo hai menzionato, ho pensato che valesse la pena menzionarlo.
Detto questo, un approccio più generale alla risposta a questa domanda potrebbe essere basato sulla teoria delle lingue e degli automi. Gli automi finiti deterministici sono processori di stringa O (n). Cioè, data una stringa di lunghezza n, elaborano la stringa esattamente in n passaggi (molto dipende da come si definiscono gli automi finiti deterministici; tuttavia, un DFA certamente non richiede più passaggi). Gli automi finiti non deterministici riconoscono gli stessi linguaggi (insiemi di stringhe) dei DFA e possono essere trasformati in DFA, ma per simulare un NFA su una macchina sequenziale e deterministica, è necessario esplorare in genere uno "spazio di ricerca" ad albero che può aumentare la complessità drammaticamente. Le lingue normali non sono molto "complesse" in senso computazionale,
Allo stesso modo puoi guardare altri livelli della gerarchia di lingue di Chomsky: senza contesto deterministico, senza contesto (compresi i linguaggi non deterministici senza contesto, che non possono essere necessariamente riconosciuti dagli automi deterministici di pushdown), i linguaggi sensibili al contesto, i ricorsivi e ricorsivi lingue enumerabili e lingue indecidibili.
Automi diversi differiscono principalmente nella loro memoria esterna; vale a dire, quale memoria esterna è necessaria affinché gli automi elaborino correttamente le lingue di un certo tipo. Gli automi finiti non hanno memoria esterna; I PDA hanno uno stack e le macchine di Turing hanno un nastro. È quindi possibile interpretare la complessità di un particolare problema di programmazione (che corrisponde a una lingua) da correlare alla quantità o al tipo di memoria richiesta per riconoscerlo. Se non è necessaria alcuna quantità di memoria fissa o limitata per riconoscere tutte le stringhe in una lingua, è una lingua normale. Se tutto ciò di cui hai bisogno è uno stack, hai un linguaggio senza contesto. Eccetera.
In generale, non sarei sorpreso se le lingue più alte nella gerarchia di Chomsky (quindi con maggiore complessità) tendano anche ad avere una maggiore entropia in senso teorico dell'informazione. Detto questo, probabilmente potresti trovare molti controesempi a questa idea, e non ho idea se ci sia qualche merito.
Inoltre, questo potrebbe essere meglio chiesto al "teorico cs" (cstheory) StackExchange.