Una determinata lingua normale contiene un sottoinsieme infinito senza prefisso?

Una serie di parole su un alfabeto finito è priva di prefisso se non ci sono due parole distinte in cui una è un prefisso dell'altra.

La domanda è:

Qual è la complessità del controllo se una lingua normale indicata come NFA contiene un sottoinsieme infinito senza prefisso?

Risposta (grazie a Mikhail Rudoy, qui sotto) : può essere fatto in tempo polinomiale, e penso anche in NL.

Parafrasando la risposta di Mikhail, lascia che sia l'input NFA nella forma normale (nessuna transizione epsilon, trim), e lascia che (resp. ) essere la lingua ottenuta avendo lo stato come stato iniziale e come stato finale (rispettivamente stato come iniziale e l'insieme come finale). Per una parola let essere la parola infinita ottenuto mediante iterazione . $(\Sigma,q_0,F,\delta)$ $L[p,r]$ $L[p,R]$ $p$ $\{r\}$ $p$ $R$ $u$ $u^\omega$ $u$

Sono equivalenti:

La lingua contiene un sottoinsieme infinito senza prefisso. $L[q_0,F]$
$\exists q \in Q$ , modo che non sia un prefisso di . $\exists u \in L[q,q]\smallsetminus\{\varepsilon\}$ $\exists v \in L[q,F]$ $v$ $u^\omega$
$\exists q \in Q$ $L[q,q] \neq \{\varepsilon\}$ $\forall u \in L[q,q]$ $\exists v \in L[q,F]$ modo che non sia un prefisso di . $v$ $u^\omega$

Prova:

3 2 banale. $\Rightarrow$

Per 2 1, è sufficiente vedere che per ogni abbiamo che è un sottoinsieme infinito senza prefisso di . $\Rightarrow$ $w \in L[q_0,q]$ $w (u^{|v|})^* v$ $L[q_0,F]$

Infine, 1 3 è la prova di "correttezza" nella risposta di Mikhail. $\Rightarrow$

— Googlo
fonte

Risposte:

Il tuo problema può essere risolto in tempo polinomiale.

Per iniziare, converti l'NFA specificato in un NFA equivalente con le seguenti proprietà aggiuntive:

Non ci sono transizioni epsilon
Tutti gli stati sono raggiungibili dallo stato iniziale

Utile subroutine

Supponiamo di avere un NFA , uno stato e una stringa non vuota . La seguente subroutine ci consentirà di valutare il valore di verità della seguente istruzione: "ogni percorso in dallo stato a uno stato di accettazione corrisponde a una stringa che è un prefisso di stringa per alcuni ". Inoltre, questa subroutine verrà eseguita in tempo polinomiale. $N$ $q$ $s$ $N$ $q$ $s^n$ $n$

Innanzitutto, costruisci NFA con dichiara che accetta tutte le stringhe che non sono prefissi di per qualsiasi ( non accettazione in un ciclo per tenere traccia di dove nel "modello" di siamo così lontani, e uno accetta stato per se abbiamo già deviato da quel modello). Quindi, costruisci NFA che è esattamente come ma ha come stato iniziale. Infine, costruisci un NFA finale cui lingua è $S$ $|s| + 1$ $s^n$ $n$ $|s|$ $sssss\ldots$ $N'$ $N$ $q$ $N''$ $L(N'')$ $L(S) \cap L(N')$ utilizzando la costruzione standard dell'intersezione NFA. Si noti che tutte queste costruzioni sono polinomiali nella dimensione dell'input.

Quindi prova semplicemente se il linguaggio di è vuoto (cosa che può essere fatta in tempo polinomiale con una semplice ricerca grafica). se e solo se , o in altre parole ogni stringa in non è in . In altre parole, la lingua di è vuota se e solo se accetta solo stringhe che sono prefissi di per alcuni . Questo può essere riformulato esattamente come l'istruzione che stavamo cercando di valutare: "ogni percorso in dallo stato a uno stato di accettazione corrisponde a una stringa che è un prefisso di stringa $N''$ $L(N'') = \emptyset$ $L(S) \cap L(N') = \emptyset$ $L(N')$ $L(S)$ $N''$ $N'$ $s^n$ $n$ $N$ $q$ $s^n$ per qualche . " $n$

Algoritmo principale

Considera l'insieme di stati nell'NFA che si trovano in qualche ciclo. Per ciascuno di tali stati, , attenere alla seguente procedura: $q$

Sia qualsiasi ciclo semplice contenente . Let tramite la stringa corrispondente al ciclo . Poiché NFA non ha transizioni epsilon, non è vuoto. Quindi applicare la subroutine a NFA, stato e stringa . Se la subroutine ci dice che ogni percorso che inizia con nell'NFA e termina in uno stato di accettazione corrisponde a un prefisso di per alcuni continua con lo stato successivo . In caso contrario, viene emesso che il linguaggio NFA specificato contiene un sottoinsieme infinito privo di prefex. $P_2$ $q$ $s$ $P_2$ $s$ $q$ $s$ $q$ $s^n$ $n$ $q$

Se proviamo tutti gli stati che si trovano in un ciclo e l'algoritmo non viene mai emesso, allora emettiamo che il linguaggio NFA dato non contiene un sottoinsieme infinito privo di prefex. $q$

Correttezza (prima metà)

In primo luogo, supponiamo che l'algoritmo sopra riportato asserisca che il linguaggio NFA specificato contenga un sottoinsieme infinito privo di prefex. Diciamo che questo output è stato selezionato considerando alcuni loop e alcuni stati . Come prima, è la stringa corrispondente a . Quindi sappiamo in base alla subroutine che non tutti i percorsi che iniziano con nell'NFA e terminano in uno stato di accettazione corrispondono a un prefisso di per alcuni (poiché questo è l'unico output della subroutine che porterebbe al principale algoritmo in uscita a quella ). $P_2$ $q$ $s$ $P_2$ $q$ $s^n$ $n$ $q$

Sia un percorso la cui esistenza è affermata dalla subroutine: un percorso da a uno stato di accettazione tale che la stringa corrispondente sia un prefisso di per qualsiasi . $P_3$ $q$ $t$ $s^n$ $n$

Sia costituito da copie di dove è sufficientemente grande da. Poiché è un ciclo attraverso , può essere trattato come un percorso da a . La stringa corrispondente a è $P_2'$ $m$ $P_2$ $m$ $m|s| > |t|$ $P_2$ $q$ $P_2'$ $q$ $q$ $P_2'$ $s^m$

Sia un percorso dallo stato iniziale a (che esiste poiché ogni stato è raggiungibile dall'inizio) e sia la stringa corrispondente a questo percorso. $P_1$ $q$ $r$

Quindi il percorso costituito da , copie di e è un percorso di calcolo accettabile. La stringa corrispondente a questo percorso è . Pertanto, l'NFA accetta ogni stringa del modulo . Questa è una serie infinita di stringhe accettata dall'NFA e sostengo che questa serie di stringhe è priva di prefissi. In particolare, supponiamo che sia un prefisso di con . In altre parole, è un prefisso di . Poiché ha lunghezza, questo implica che $P_1$ $x$ $P_2'$ $P_3$ $r(s^m)^xt$ $r(s^m)^xt$ $r(s^m)^xt$ $r(s^m)^yt$ $y > x$ $t$ $(s^m)^{y-x}t$ $(s^m)^{y-x}$ $m(y-x)|s| \ge m|s| > |t|$ $t$ è un prefisso di . Ma dall'output della subroutine sappiamo che non è un prefisso di per nessun . Pertanto, non può essere un prefisso di e, come desiderato, l'insieme di stringhe è privo di prefisso. $(s^m)^{y-x} = s^{m(y-x)}$ $t$ $s^n$ $n$ $r(s^m)^xt$ $r(s^m)^yt$

Pertanto, ho dimostrato che se l'algoritmo principale produce che il linguaggio NFA dato contiene un sottoinsieme infinito privo di prefex, questo è effettivamente il caso.

Correttezza (seconda metà)

Successivamente, mostrerò l'altra metà: se il linguaggio NFA dato contiene un sottoinsieme infinito privo di prefex, l'algoritmo principale produrrà questo fatto.

Supponiamo che il linguaggio NFA specificato contenga un sottoinsieme infinito privo di prefissi. Sia l'insieme dei percorsi di calcolo (accettanti) corrispondenti a queste stringhe. Si noti che è un insieme infinito di percorsi di calcolo che accettano le cui stringhe corrispondenti non sono mai prefissi l'una dell'altra. $A$ $A$

Supponiamo che uno stato sia "in loop" nell'NFA se esiste un loop nell'NFA attraverso quello stato e "non-loop" in caso contrario. Considera tutti i percorsi dallo stato iniziale a qualsiasi stato di ciclo che attraversa solo stati non di ciclo (tranne per lo stato di un ciclo in cui finiscono). Lascia che sia l'insieme di questi percorsi. Ogni percorso non può avere un ciclo poiché gli stati in quel ciclo sarebbero stati di ciclo e quindi passerebbe attraverso uno stato di ciclo. Pertanto, le lunghezze dei percorsi in sono limitate dal numero di stati nell'NFA e quindi è finito (ad esempio, se lo stato iniziale è uno stato di looping, l'unico percorso di questo tipo è il percorso vuoto). $P$ $p \in P$ $p$ $P$ $P$

Possiamo suddividere in sottoinsiemi in base a come iniziano i percorsi di calcolo inIn particolare, per , lascia l'insieme di tutti i percorsi di calcolo in che iniziano con il percorso e lasciare l'insieme di tutti gli altri percorsi di . Chiaramente, tutti s e sono disgiunti e la loro unione è l'intero set . Inoltre, contiene solo percorsi che non passano mai attraverso uno stato di loop e quindi mai loop; quindi è finito. Possiamo quindi concludere che alcuni $A$ $|P|+1$ $A$ $p \in P$ $A_p$ $A$ $p$ $B$ $A$ $A_p$ $B$ $A$ $B$ $B$ $A_p$ deve essere infinito (altrimenti sarebbe un'unione di molti insiemi finiti). $A$

Poiché è infinito, ci sono infiniti percorsi di calcolo, nessuno dei quali stringhe sono prefissi l'uno dell'altro, che accettano percorsi che iniziano con . Sia lo stato raggiunto alla fine del percorso . Possiamo concludere che ci sono infiniti percorsi di accettazione, chiamiamo questo insieme , a partire da tutti corrispondenti a stringhe che non sono prefissi l'una dell'altra. $A_p$ $p$ $q$ $p$ $A'$ $q$

Durante l'algoritmo principale, eseguiamo la subroutine sullo stato e alcune stringhe . Questa subroutine ci dice se ogni percorso accettante che inizia con corrisponde a una stringa che è un prefisso di per alcuni . Se così fosse, allora tutti i infiniti percorsi accettanti in sarebbero prefissi di per varie , il che implicherebbe che sono tutti prefissi l'uno dell'altro. Questo non è il caso, quindi concludiamo che quando l'algoritmo principale esegue la subroutine sullo stato $q$ $s$ $q$ $s^n$ $n$ $A'$ $s^n$ $n$ $q$ , il risultato è l'altro possibile risultato. Ciò, tuttavia, porta l'algoritmo principale a generare che il linguaggio NFA contiene un sottoinsieme infinito privo di prefissi.

Questo conclude la prova di correttezza.

— Mikhail Rudoy
fonte

Non capisco come funziona la gestione dei loop, poiché un dato stato può far parte (in modo esponenziale) di molti loop. Naturalmente, se uno qualsiasi di questi due loop può essere utilizzato per generare una sequenza non periodica, allora abbiamo finito.

q $q$

— japh

Cosa intendi con gestione dei loop? Nell'algoritmo principale, per ogni stato si sceglie solo un ciclo che attraversa (qualsiasi loop fuori da quelli potenzialmente esponenzialmente molti) e si chiama quel ciclo (dopodiché si esegue la subroutine sullo stato e stringa dove è la stringa associato a ). La subroutine gestisce essenzialmente la verifica della possibilità di generare una sequenza non periodica utilizzando quel loop. Se sì, allora abbiamo finito. Se no (e inoltre no per ogni ), allora l'intero linguaggio è un'unione di sequenze periodiche, quindi abbiamo anche finito.

q $q$

P2 $P_2$

q $q$

s $s$

P2 $P_2$

q $q$

— Mikhail Rudoy,

Per chiarire la mia domanda, ecco un semplice NFA con stato iniziale , stato finale e tre transizioni: , , . Il ciclo per non genererà le stringhe prive di prefisso, ma il ciclo per farà.

q $q$

T $T$

q→aq $q \overset{a}{\rightarrow} q$

q→bq $q \overset{b}{\rightarrow} q$

q→aT $q \overset{a}{\rightarrow} T$

a $a$

b $b$

— japh

In realtà, il ciclo per non genera un set gratuito prefisso: l'insieme delle stringhe tutto utilizzare il ciclo. Nel mio algoritmo, se il circuito si sceglie per è il ciclo, allora la subroutine determinerà che no, non ogni percorso accettando a partire da ha una serie di forma , e così l'algoritmo principale dirà che un infinito esiste un sottoinsieme privo di prefissi. Se il ciclo utilizzato dall'algoritmo per è invece il ciclo la subroutine determina che non tutti i percorsi di accettazione che iniziano con hanno una stringa del modulo

a $a$

a∗ba $a^*ba$

a $a$

q $q$

a $a$

q $q$

a∗ $a^*$

q $q$

b $b$

q $q$

b∗ $b^*$ e anche in questo caso l'algoritmo ha lo stesso output.

— Mikhail Rudoy,

Grazie Mikhail! Penso che la tua risposta risolva la domanda.

— Googlo

definizioni

Definizione 1 : Sia un insieme di parole. Diciamo che è privo di prefissi piacevolmente infinito (nome ai fini di questa risposta) se ci sono parole e tali che: $S$ $S$ $u_0,\dots,u_n,\dots$ $v_1,\dots,v_n,\dots$

Per ogni , e sono non vuoti e iniziano con lettere distinte; $n\ge 1$ $u_n$ $v_n$
$S=\{u_0v_1,\dots,u_0\dots u_n v_{n+1},\dots\}$ .

L'intuizione è che puoi mettere tutte quelle parole su un infinito albero radicato (la ■radice è, le ▲foglie •sono e i rimanenti nodi interni) della forma seguente in modo che le parole in siano esattamente le etichette dei percorsi dalla radice a una foglia: $S$

   u₀    u₁    u₂
■-----•-----•-----•⋅⋅⋅
      |     |     |
      | v₁  | v₂  | v₃
      |     |     |
      ▲     ▲     ▲

Proposizione 1.1 : Un set senza prefisso piacevolmente infinito è senza prefisso.

Prova della proposizione 1.1 : Supponiamo che sia un prefisso rigoroso di . Esistono due casi: $u_0\dots u_n v_{n+1}$ $u_0 \dots u_m v_{m+1}$

Se allora è un prefisso di . Questo è impossibile perché e hanno le prime lettere distinte. $n < m$ $v_{n+1}$ $u_{n+1}\dots u_m v_{m+1}$ $u_{n+1}$ $v_{n+1}$
Se allora è un prefisso di . Questo è impossibile perché e hanno le prime lettere distinte. $n > m$ $u_{m+1}\dots u_n v_{n+1}$ $v_{m+1}$ $u_{m+1}$ $v_{m+1}$

Proposizione 1.2 : Un set senza prefissi piacevolmente infinito è infinito.

Prova della proposizione 1.2 : nella prova 1.1, abbiamo dimostrato che se allora e non sono comparabili per l'ordine dei prefissi. Non sono quindi uguali. $n\not= m$ $u_0\dots u_n v_{n+1}$ $u_0 \dots u_m v_{m+1}$

Prova principale

Proposizione 2 : qualsiasi set infinito senza prefisso contiene un bel set infinito senza prefisso.

Proposizione 3 : una lingua contiene un set senza prefisso infinito se e solo se contiene un set senza prefisso piacevolmente infinito.

Prova di seguito.

Prova della proposizione 3 : della proposizione 2. proposizioni 1.1 e 1.2. $\boxed{\Rightarrow}$ $\boxed{\Leftarrow}$

Proposizione 4 : l'insieme di sottoinsiemi ben privi di prefissi di un linguaggio normale (codificato come una parola infinita ) è -regolare (e la dimensione dell'automa di Büchi che lo riconosce è polinomiale nella dimensione dell'NFA che riconosce il linguaggio normale). $\overline{u_0}\widehat{v_1}\overline{u_1}\widehat{v_2}\overline{u_2}\dots$ $\omega$

Prova di seguito.

Teorema 5 : Decidere se un linguaggio regolare descritto da un NFA contiene un sottoinsieme infinito senza prefisso può essere fatto in un polinomio temporale nella dimensione del NFA.

Prova del teorema 5 : secondo la proposizione 3, è sufficiente verificare se contiene un sottoinsieme privo di prefissi piacevolmente infinito, che può essere fatto in un tempo polinomiale costruendo l'automa di Büchi dato dalla proposizione 4 e verificando la non vuoto del suo linguaggio (che può essere fatto in tempo lineare nella dimensione dell'automa di Büchi).

Prova della proposizione 2

Lemma 2.1 : Se è un set privo di prefissi, allora lo è anche (per qualsiasi parola ). $S$ $w^{-1}S$ $w$

Prova 2.1 : per definizione.

Lemma 2.2 : Sia un insieme infinito di parole. Let sia comune prefisso più lungo di tutte le parole di . e hanno lo stesso cardinale. $S$ $w:=\operatorname{lcp}(S_n)$ $S$ $S$ $w^{-1}S$

Prova 2.2 : Definisci con . È ben definito per definizione di , iniettivo per definizione di e suriettivo per definizione di . $f:w^{-1}S\to S$ $f(x)=wx$ $w^{-1}S$ $f$ $w$

Prova della proposizione 2 : costruiamo e per induzione su , con l'ipotesi di induzione composta dalle seguenti parti: $u_n$ $v_n$ $n$ $H_n$

$(P_1)$ Per tutti , ; $k\in\{1,\dots,n\}$ $u_0\dots u_{k-1} v_k \in S$
$(P_2)$ Per tutti , e sono non vuoti e iniziano con lettere distinte; $k\in\{1,\dots,n\}$ $u_k$ $v_k$
$(P_3)$ $S_n:=(u_0\dots u_n)^{-1}S$ è infinito;
$(P_4)$ Non esiste un prefisso non vuoto comune a tutte le parole in . In altre parole: non esiste lettera tale che . $S_n$ $a$ $S_n\subseteq a\Sigma^*$

Nota 2.3 : Se abbiamo sequenze che verificano senza , possiamo modificare per farle soddisfare anche . In effetti, è sufficiente sostituire con . non è interessato. è banale. è di costruzione. è di lemma 3. $H_n$ $(P_4)$ $u_n$ $(P_4)$ $u_n$ $u_n\operatorname{lcp}(S_n)$ $(P_1)$ $(P_2)$ $(P_4)$ $(P_3)$

Costruiamo ora le sequenze per induzione su : $n$

Inizializzazione: è vero prendendo (cioè prendendo e applicando l'osservazione 3.1). $H_0$ $u_0:=\operatorname{lcp}(S)$ $u_0:=\varepsilon$
Fase di induzione: supponiamo di avere parole e tali che per qualche . Costruiremo e tale che . $u_1,\dots,u_n$ $v_1,\dots,v_n$ $H_n$ $n$ $u_{n+1}$ $v_{n+1}$ $H_{n+1}$

Poiché è infinito e privo di prefissi (per il lemma 1), non contiene modo che . Poiché è infinito, esiste una lettera tale che è infinito. Per , c'è una lettera distinta da tale che non è vuoto. Scegli . Prendendo per essere sarebbero soddisfare , e $S_n$ $\varepsilon$ $S_n=\underset{a\in \Sigma}{\bigsqcup}(S_n\cap a\Sigma^*)$ $S_n$ $a$ $S_n\cap a\Sigma^*$ $(P_4)$ $b$ $a$ $S_n\cap b\Sigma^*$ $v_{n+1}\in S_n\cap b\Sigma^*$ $u_{n+1}$ $a$ $(P_1)$ $(P_2)$ $(P_3)$ quindi applichiamo l'osservazione 3.1 per ottenere : . $(P_4)$ $u_{n+1}:=a\operatorname{lcp}(a^{-1}S_n)$

$(P_1)$ $u_1\dots u_nv_{n+1}\in u_1\dots u_n(S_n\cap b\Sigma^*)\subseteq S$ .

$(P_2)$ Per definizione di e . $u_{n+1}$ $v_{n+1}$

$(P_3)$ $a^{-1}S_n$ è infinito per definizione di , e è quindi infinito per lemma 3. $a$ $S_{n+1}$

$(P_4)$ Per definizione di . $u_{n+1}$

Prova della proposta 4

Prova della proposizione 4 : Sia essere un NFA. $A=(Q,\to,\Delta,q_0,F)$

L'idea è la seguente: leggiamo , ricordiamo dove siamo, leggiamo , torniamo indietro a dove eravamo dopo aver letto , leggiamo , ricordati dove siamo, ... Ricordiamo anche la prima lettera che è stata letta in ogni per garantire che inizi con un'altra lettera. $u_0$ $v_1$ $u_0$ $u_1$ $v_n$ $u_n$

Mi è stato detto che questo potrebbe essere più semplice con gli automi multi-testa, ma non ho molta familiarità con il formalismo, quindi lo descriverò semplicemente usando un automa Büchi (con una sola testa).

Abbiamo impostato , in cui verranno utilizzati i simboli overlined per descrive s ed i simboli con i cappelli per l' s. $\Sigma':=\overline{\Sigma}\sqcup\widehat{\Sigma}$ $u_k$ $v_k$

Abbiamo impostato , dove: $Q':=Q\times (\{\bot\}\sqcup (Q \times \Sigma))$

$(q,\bot)$ significa che stai leggendo un po 'di ; $u_n$
$(q,(p,a))$ significa che hai finito di leggere nello stato , che ora stai leggendo che inizia con una e che, una volta terminato , tornerai a per leggere un che non inizia con . $u_n$ $p$ $v_{n+1}$ $a$ $p$ $u_{n+1}$ $a$

Abbiamo impostato , perché si parte dalla lettura . $q_0':=(q_0,\bot)$ $u_0$

Definiamo come . $F'$ $F\times Q \times \Sigma$

L'insieme delle transizioni è definito come segue: $\to'$

" " Per ogni transizione , aggiungi ; $u_n$ $q\overset{a}{\to}q'$ $(q,\bot)\overset{\overline{a}}{\to'}(q',\bot)$
" to " Per ogni transizione , aggiungi ; $u_n$ $v_{n+1}$ $q\overset{a}{\to}q'$ $(q,\bot)\overset{\widehat{a}}{\to'}(q',(q,a))$
" " Per ogni transizione , aggiungi ; $v_n$ $q\overset{a}{\to}q'$ $(q,(p,a))\overset{\widehat{a}}{\to'}(q',(p,a))$
" a " Per ogni transizione dove è finale e la lettera distinta da , aggiungi ; $v_n$ $u_n$ $p\overset{a}{\to}p'$ $p$ $b$ $a$ $(q,(p,b))\overset{\overline{a}}{\to'}(p',\bot)$

Lemma 4.1 : è accettato da iff per ogni , e non sono vuoti e iniziano con lettere distinte e per ogni , . $\overline{u_0}\widehat{v_1}\overline{u_1}\widehat{v_2}\dots \overline{u_n}\widehat{v_{n+1}}$ $A'$ $n\ge 1$ $u_n$ $v_n$ $n\ge 0$ $u_0\dots u_n v_{n+1}\in L(A)$

Prova del lemma 4.1 : lasciato al lettore.

— xavierm02
fonte