Asintotici del numero di parole in una lingua regolare di una determinata lunghezza


28

Per una lingua normale , sia il numero di parole in della lunghezza . Utilizzando la forma canonica Jordan (applicata alla matrice di transizione non annotata di alcuni DFA per ), si può dimostrare che per abbastanza grande , dove sono polinomi complessi e sono "autovalori" complessi. (Per piccolo , potremmo avere termini aggiuntivi nella forma , dove è se eLcn(L)LnLn

cn(L)=i=1kPi(n)λin,
PiλinCk[n=k][n=k]1n=k0altrimenti. Questi corrispondono a blocchi Jordan di dimensioni almeno con autovalore ).k+10

Questa rappresentazione sembra implicare che se è infinito, allora asintoticamente, per alcuni . Tuttavia, questo è palesemente falso: per la lingua su di tutte le parole di lunghezza pari, ma . Ciò suggerisce che per alcuni e per tutti , per abbastanza grande oppure . Ciò è dimostrato in Flajolet e SedgewickLcn(L)CnkλnC,λ>0L{0,1}c2n(L)=22nc2n+1(L)=0da{0,,d1}cdm+a(L)=0mcdm+aCa(dm+a)kaλadm+a (Teorema V.3), che attribuisce la prova a Berstel.

La prova fornita da Flajolet e Sedgewick è alquanto tecnica; così tecnico, infatti, che lo disegnano solo. Ho tentato una prova più elementare usando la teoria di Perron-Frobenius. Possiamo considerare il grafico di transizione del DFA come un digrafo. Se il digrafo è primitivo, il risultato segue quasi direttamente dal teorema di Perron-Frobenius. Se il digrafo è irriducibile ma imprimibile con l'indice , allora considerando la " potenza" del DFA (ogni transizione corrisponde ai simboli ), otteniamo lo stesso risultato. Il caso difficile è quando il digrafo è riducibile. Possiamo ridurre al caso di un percorso di componenti fortemente connessi e quindi ottenere il risultato stimando le somme del modulo rrr

m1++mk=mi=1kλimi.
(Ciascuna di queste somme corrisponde a un modo particolare di accettare una parola, passando attraverso i diversi componenti in un certo modo.) Questa somma, a sua volta, può essere stimata individuando il termine più grande, che corrisponde a . Per ogni autovalore che viene ripetuto volte, otteniamo un fattore aggiuntivo di .milogλirΘ(mr1)

La prova ha i suoi bordi grezzi: nel caso riducibile, dobbiamo passare dai termini asintotici a alla somma sopra menzionata, quindi dobbiamo stimare la somma.Cλim

La prova di Flajolet e Sedgewick è forse più semplice, ma meno elementare. Il suo punto di partenza è la funzione generatrice razionale di , e comporta l'induzione sul numero di magnitudini polari (!). L'idea di base è che tutti gli autovalori del modulo massimo sono radici dell'unità (se normalizzati dal loro modulo), a causa di un teorema (moderatamente facile) di Berstel. Scegliendo una appropriata e osservando le parole di lunghezza , tutti questi autovalori diventano reali. Considerando l'espansione parziale della frazione, otteniamo che se l'autovalore del modulo massimo "sopravvive", allora determina gli asintotici, che sono della formacn(L)ddm+aCnkλn. Altrimenti, troviamo una nuova funzione di generazione razionale che corrisponde solo a parole di questa lunghezza (usando un prodotto Hadamard) e ripetiamo l'argomento. La quantità di cui sopra continua a diminuire, e così alla fine troviamo gli asintotici desiderati; potrebbe avere a crescere nel processo, per riflettere tutto ciò che accade nei passaggi induttivi.d

Esiste una prova semplice ed elementare per la proprietà asintotica di ?cn(L)


A quale "proprietà asintotica" ti riferisci, quella proprio in alto?
Raffaello

Esattamente quella proprietà.
Yuval Filmus,

Per il caso riducibile, non ci sono semplici limiti combinatori (forse ottenuti considerando i sottoinsiemi di percorsi e i multiset di percorsi)?
András Salamon,

Ci sono limiti facili, ma probabilmente perdi fattori polinomiali lì. C'è una somma con molti termini polinomiali e possiamo stimarla usando il termine più grande. Tuttavia, questo non ci darà l'asintotico corretto, poiché gli altri termini decadono abbastanza rapidamente. Forse è possibile una stima con un integrale, ma questo sta già diventando un po 'confuso.
Yuval Filmus,

1
in generale, trovare prove alternative o più elementari dei problemi può essere molto difficile ed è principalmente un esercizio teorico ... c'è qualche ulteriore motivazione / bkg / applicazione? suggerire di migrare a Cstheory.
vzn,

Risposte:


3

L'argomento che hai abbozzato sembra essere in linea con il trattamento di Richard Stanley del metodo Transfer-Matrix in Enumerative Combinatorics, Volume 1 (link: pp 573; stampa: pp 500).

Comincia con la funzione generatrice e la disimballa considerando digrafi e fattori consentiti e proibiti. Quindi si estrae dai monoidi liberi, dove usa una versione raffinata delle somme che hai dato per dimostrare:

4.7.11 Proposizione Sia un sottoinsieme di che genera liberamente . QuindiBABB(λ)=(IB(λ))1

Dopo aver esaminato alcune applicazioni, allo stesso modo chiude la sezione discutendo dei prodotti Hadamard in relazione ai poliomino convessi orizzontalmente.


Puoi indicare un teorema nel testo di Stanley che fornisce stime asintotiche?
Yuval Filmus,

Non riesco a trovare alcun riferimento immediato ed esplicito a Stanley, ma Flajolet e Sedgewick riconoscono la sua influenza sul loro trattamento del metodo della matrice di trasferimento nella sezione V.6. In particolare, Corollary V.1 comprende i teoremi precedenti (V.7, V.8) che sembrano seguire il tuo ragionamento. Sembrano anche seguire lo schema di Stanley a partire dalla sottosezione V.5, in cui la proposizione V.6 corrisponde al teorema di Stanley 4.7.2 e al corollario 4.7.3
JSS,

Quello che sto specificamente cercando è l'analisi asintotica. La formula esatta per il numero di parole di una determinata lunghezza, data dal metodo della matrice di trasferimento, è ciò che dò per scontato.
Yuval Filmus,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.