La lingua di coppie di parole di uguale lunghezza la cui distanza di percussione è 2 o maggiore è senza contesto?

Il seguente contesto linguistico è gratuito?

L = {u x v y ∣ u, v, x, y \in {0, 1}^{+}, | u | = | v |, u \neq v, | x | = | y |, x \neq y}

$L = \{ uxvy \mid u,v,x,y \in \{ 0,1 \}^+, |u| = |v|, u \neq v, |x| = |y|, x \neq y\}$

Come sottolineato da sdcvvc, una parola in questa lingua può anche essere descritta come la concatenazione di due parole della stessa lunghezza la cui distanza di battuta è 2 o maggiore.

Penso che non sia privo di contesto ma sto facendo fatica a dimostrarlo. Ho provato a intersecare questa lingua con una lingua normale (come per esempio), quindi uso il lemma di pompaggio e \ o gli omomorfismi, ma ho sempre una lingua troppo complicata per caratterizzare e scrivere giù. $\ 0^*1^*0^*1^*$

— Robert777
fonte

Hai provato a pompare la stringa

0^{u} 1^{x} 1^{u} 0^{x}

$0^u1^x1^u0^x$ ?

— Pål GD,

Sì, ma non sono riuscito a pompare questa stringa fuori dal linguaggio (ciò non significa che non sia possibile, solo che non sono riuscito a farlo).

— Robert777,

@ PålGD, probabilmente avresti bisogno di un modo per "segnare" i pezzi, come

1^{u} 0 1^{x} 0 1^{u} 0 1^{x} 0

$1^u 0 1^x 0 1^u 0 1^x 0$

— vonbrand

Questa lingua può essere scritta come

dove

è la distanza di Hamming. Nota che se sostituiamo 2 per 1, è privo di contesto ( cs.stackexchange.com/questions/307 ) ma il trucco usato non funzionerà. Personalmente scommetto che non è contestuale.

{u v : | u | = | v |, d (u, v) \geq 2}

$\{uv:|u|=|v|,d(u,v) \geq 2\}$

d

$d$

— sdcvvc,

@sdcvvc: hai ragione, una partiziona

modo che uno dei bit differenti sia in

e l'altro in

. Sono corretto.

u

$u$

u^{'} x

$u'x$

u^{'}

$u'$

x

$x$

— András Salamon,

Risposte:

Nota [30-07-2019] La prova è sbagliata ... la domanda è più complicata di quanto sembri.

Dopo un tentativo fallito qui è un'altra idea.

Se interseciamo $L$ con la lingua normale $L_{reg} = 0^*10^*10^*10^*$ otteniamo un linguaggio CF.

Forse possiamo avere più fortuna se usiamo $L_{reg}' = 0^*10^*10^*10^*10^*$ (una stringa con esattamente 4 1s).

Sia $L_1 = L \cap L_{reg}'$ , informalmente $w \in L_1$ se può essere diviso in due metà, in modo tale che una metà contenga esattamente $\{0,1,3,4\}$ $1s$ o entrambe le metà contengano due $1$ s ma le loro posizioni non corrispondono.

Supponi che $L_1$ sia CF e che $G$ sia la sua grammatica nella forma normale di Chomsky, e lascia

w = u v = 0^{a} 1 0^{b} 1 0^{c} 1 0^{d} 1 0^{e} \in L_{1}

$w = uv = 0^a 1 0^b 1 0^c 1 0^d 1 0^e \in L_1$

Abbiamo $|u|=|v|$ (lunghezza pari) e $d(u,v) \geq 2$

Se limitiamo la nostra attenzione ai modi in cui i quattro 1 di $w$ possono essere generati, abbiamo i tre casi mostrati nella parte superiore della figura 1. La parte centrale della figura 1 mostra il primo caso (ma gli altri sono simili) .

inserisci qui la descrizione dell'immagine
Figura 1 (l'immagine completa può essere scaricata qui )

Se prendiamo $a=e, c=2a$ e $b,d \gg a$ vediamo che gli zeri tra le due coppie di 1s devono essere indipendentemente pompabili (nodi rossi in figura): in particolare, per abbastanza grande $b \gg a$ , otteniamo un nodo non terminale duplicato su una sottostruttura interna (nodo X in figura 2) o una sottosequenza ripetuta nel percorso verso il primo o il secondo 1 (nodo Y in figura 2). Si noti che la figura 2 è un po 'semplificata: ci possono essere più nodi non terminali tra i due $X$ s, e anche tra i due $Ys$ ( $Y\to ... \to Z_i \to ... Y$ ma con $Z_i$ che produce solo 0s a destra del primo 1).

inserisci qui la descrizione dell'immagine
figura 2

Quindi possiamo correggere un arbitrario $a = e = k, c = 2a$ , quindi selezionare $b$ abbastanza grande da ottenere un nodo pompabile in modo indipendente sulla sequenza di zeri tra il primo e il secondo $1$ . Per la sequenza di zeri tra il terzo e il quarto 1, possiamo scegliere $d = b! +b$ .
Ma $0^b$ è pompabile in modo indipendente quindi esiste una $p \leq b$ sottostringa pompabile $y$ , ovvero tale che $b = xyz, |y|=p, |x|\geq 0, |z|\geq 0$ e $xy^iz = b!+b$ . La stringa che otteniamo è:

w^{'} = 0^{k} 1 0^{b! + b} 1 0^{2 k} 1 0^{b! + b} 1 0^{k}

$w' = 0^k 1 0^{b!+b} 1 0^{2k} 1 0^{b!+b} 1 0^k$

ma $w' \notin L_1$ . Quindi $L_1$ non è CF e infine $L$ non è CF.

Se la prova è corretta (???) può essere estesa a tutte le lingue $L_k = \{ uv : |u|=|v|, d(u,v)\geq k\}, k\geq 2$

— vor
fonte

Temo che la generosità scadrà prima che possiamo effettivamente verificare questa prova, quindi a meno che non emergano informazioni drastiche nelle prossime 4 ore, questo ottiene i punti per essere il miglior tentativo finora.

— jmite,

@jmite: non preoccuparti, ci sono alte probabilità che si tratti di un tentativo sbagliato come quello precedente (che è durato circa 30 minuti prima di scoprire un errore banale) :-) :-)

— Vor

Perché la distinzione caso? I rami nella grammatica non hanno alcuna relazione con le metà della parola. Ma penso che non abbia importanza; se la dimostrazione funziona, non è necessario distinguere questo caso. Guardare una grammatica presunta e usare la prova del lemma di pompaggio invece del lemma stesso è un bel trucco (uno dovrebbe farlo più spesso). Ho una (vera) preoccupazione: se pompi una sottostringa di

, ottieni

; Non vedo come arrivi a

. Non pensare che ciò possa danneggiare la prova, ma controlla meglio. Inoltre, potresti voler raddrizzare qualche notazione (e errori di battitura).

0^{b}

$0^b$

0^{b + p (i - 1)}

$0^{b+p(i-1)}$

b + b!

$b+b!$

— Raffaello

@Raphael: grazie per i commenti. Forse mi sbaglio, ma se scegli come lunghezza target

quindi per ogni lunghezza di pompaggio

, la stringa

può essere scomposta in

e può essere pompata a

, anzi nel tuo esempio p sicuramente divide

b + b!

$b+b!$

p

$p$

0^{b}

$0^b$

0^{x y z}, (| x y z | = b, | y | = p \leq b)

$0^{xyz}, (|xyz|=b, |y|=p \leq b)$

x y^{i} z = b + b!

$xy^iz = b + b!$

b!

$b!$ , quindi c'è un

per cui

, ma la lunghezza della stringa originale è

, quindi la lunghezza totale pompata è

. Lo ricordo da un paio di esercizi che usano il lemma di Ogden ... ora li ricontrollerò.

(i - 1)

$(i-1)$

p (i - 1) = b!

$p(i-1)=b!$

b

$b$

| x y^{(i - 1)} z | = b + b!

$|xy^{(i-1)}z| = b+b!$

— Vor,

@Raphael: ... non ha trovato l'ovunque la prova, ma solo un articolo di Zach Tomaszewski che dimostra che il complemento di

è CF (vedi domanda ), quindi forse si tratta di un nuovo risultato (anche se semplice); e un teorema di tipo lemma di pompaggio può essere derivato per le lingue con stringhe che contengono un numero finito di un particolare simbolo e sottostringhe di lunghezza arbitraria tra di loro.

L_{d u p} = {w w}

$L_{dup} = \{ ww \}$

— Vor,

Dopo 2 tentativi falliti, che sono stati confutati da @Hendrik Jan (grazie), eccone un altro, che non ha più successo. @Vor ha trovato un esempio di un linguaggio CF deterministico in cui si applica la stessa costruzione, se corretta. Ciò ha permesso di identificare un errore nell'ancoraggio della stringa nell'applicazione del lemma. Il lemma stesso non sembra essere in colpa. Questa è chiaramente una costruzione troppo semplicistica. Vedi maggiori dettagli nei commenti. $y$

La lingua non è privo di contesto. $L = \{ uxvy \mid u,v,x,y \in \{ 0,1 \}^*\text \{ \epsilon \} \ ,\ \mid u \mid = \mid v \mid \ , \ u \not= v \ , \ \mid x \mid = \mid y \mid \ , \ x \not= y \ \}$

È utile tenere presente la caratterizzazione dove d è la distanza di Hamming, proposta da @sdcvvc. Ciò a cui bisogna pensare sono 2 posizioni selezionate in ciascuna mezza stringa in modo tale che i simboli corrispondenti differiscano. $L= \{uv:|u|=|v|,d(u,v) \geq 2\}$

Quindi consideri una stringa tale che e siano pari. È chiaramente nella lingua L, tagliando e ovunque tra i due 1. Vogliamo pompare quella stringa nella prima parte tra le 1, in modo che diventi che non dovrebbe essere nella lingua. $10^i10^j$ $i \lt j$ $i+j$ $u$ $x$ $10^j10^j$

Per prima cosa proviamo a usare il lemma di Ogden , che è come il lemma di pompaggio, ma si applica a o più simboli distinti che sono segnati sulla stringa, essendo la lunghezza di pompaggio per i simboli contrassegnati (ma il lemma può pompare di più perché può anche pompare simboli non contrassegnati). La lunghezza marcata di pompaggio dipende solo dalla lingua. Questo tentativo fallirà, ma il fallimento sarà un suggerimento. $p$ $p$ $p$

Possiamo quindi scegliere e contrassegnare i simboli sulla prima sequenza di 0. Sappiamo che nessuno dei due 1 sarà nella pompa, perché può pompare una volta (esponente 0) invece di pompare. E pompare i 1 ci farebbe uscire dalla lingua. $i=p$ $i$

Tuttavia, potremmo pompare su entrambi i lati del secondo 1 più velocemente o addirittura più velocemente sul lato destro, in modo che il secondo 1 non attraversi mai la metà della stringa. Anche il lemma di Ogden non fissa un limite superiore alla dimensione di ciò che viene pompato, quindi non è possibile organizzare il pompaggio per ottenere l'1 più a destra esattamente attraverso il centro della stringa.

Usiamo una versione modificata del lemma, qui chiamata Lemma di Nash, che può gestire queste difficoltà.

Abbiamo prima bisogno di una definizione (probabilmente ha un altro nome in letteratura, ma non so quale - l'aiuto è il benvenuto). Si dice che una stringa sia una cancellazione di una stringa se viene ottenuta da cancellando i simboli in . Noteremo . $u$ $v$ $v$ $v$ $u \prec v$

Lemma di Nash: se è un linguaggio privo di contesto, allora esistono due numeri e tali che per qualsiasi stringa di lunghezza almeno in , e ogni modo di "segnare" o più del le posizioni in , possono essere scritte come con stringa , , , , , tale che $L$ $p\gt0$ $q\gt 0$ $w$ $p$ $L$ $p$ $w$ $w$ $w=uxyzv$ $u$ $x$ $y$ $z$ $v$

ha almeno una posizione contrassegnata, $xz$
$xyz$ has at most $p$ marked positions, and
there are 3 strings , , such that
1. $\hat x \prec x$ , $\hat y \prec y$ , $\hat z \prec z$ ,
2. $1 \leq \mid \hat x \hat z \mid \leq q$ , $1 \leq \mid \hat y \mid \leq q$ , and
3. $ux^j\hat x^i\hat y\hat z^iz^jv$ is in $L$ for every $i \geq 0$ and for every $j \geq 0$ .

Proof: Similar to the proof of Ogden's lemma, but the subtrees corresponding to the strings $y$ and $xz$ are pruned so that they do not contain any path with twice the same non-terminal (except for the roots of these two subtrees). This necessarily limits the size of the generated strings $\hat x\hat z$ and $\hat y$ by a constant $q$ . The strings $x^j$ and $z^j$ , for $j \geq 0$ , corresponding to an unpruned version of the tree, are used mainly with $j=1$ to simplify the accounting when the lemma is applied.

We modify the above proof attempt by marking the $p$ leftmost symbols 0, but they are followed by $2q$ symbols 0 to make sure that we pump in the left part of the string, between the two 1's. That make a total of $i = p + 2q$ 0's between the 1's (actually $i = p + q$ would be sufficient, since the rightmost 1 cannot be in $\hat z$ , which would allow to simply remove it).

What is left is to have chosen $j$ so that we can pump exactly the right number of 0's so that the two sequences are equal. But so far, the only constraint on $j$ is to be greater than $i$ . And we also know that the number of 0's that are pumped at each pumping is between 1 and q. So let $h$ be product of the first $q$ integers. We choose $j=i+h$ .

Hence, since the pumping increment $d$ - whatever it is - is in $[1,q]$ , it divides $h$ . Let $k$ be the quotient. If we pump exactly $k$ times, we get a string $10^j10^j$ which is not in the language. Hence L is not context-free.

I think that I shall never see
A string lovely as a tree.
For if it does not have a parse,
The string is naught but a farce

— babou
fonte

Note however that the pass over the second half reads the stack in reverse. That seems to mean that the two positions are in the same position in both halves, but in reverse?

— Hendrik Jan

you are correct ... I goofed ... now I know what was nagging me at the back of my head.

— babou

I recognized the argument (because I could not make it work when I tried myself).

— Hendrik Jan

Should I leave this wrong answer ? It is somehow helping, I think, as it make the problem suspiciously similar to

a^{i} b^{j} c^{k} a^{i} b^{j} c^{k}

${a^ib^jc^ka^ib^jc^k}$ . The problem is that rules of the site are not intended to encourage wrong results for discussion ( I mean I do not enjoy downvotes more than anyone else).

— babou

@HendrikJan Did I goof again ? (BTW, thanks for making it a discussion)

— babou

-1

by this question I think $L$ is context-free and generated by the following grammar $\qquad\begin{align} S &\to AXBY \mid BYAX \\ A &\to 0 \mid 0A0 \mid 0A1 \mid 1A0 \mid 1A1 \\ B &\to 1 \mid 0B0 \mid 0B1 \mid 1B0 \mid 1B1 \\ X &\to 0 \mid 0X0 \mid 0X1 \mid 1X0 \mid 1X1 \\ Y &\to 1 \mid 0Y0 \mid 0Y1 \mid 1Y0 \mid 1Y1 \\ \end{align}$

— M.K. Dadsetani
fonte

This is incorrect; you cannot guard that length of AX is the same as BY. For example, your grammar generates S -> AXBY -> A011 -> 0A1011 -> 001011 which is not in the original language. Also, your symbols A and X generate the same language, same for B and Y; they can be merged.

— sdcvvc