1) Se permettiamo anche l'intersezione e il complemento, le espressioni risultanti vengono talvolta chiamate espressioni regolari estese; poiché le lingue normali sono chiuse in operazioni booleane, non si ottiene nulla da loro. È solo zucchero sintattico. Una conclusione simile vale per l'operazione inversa. Parte del motivo per cui in prima istanza non vengono menzionate tutte le altre operazioni è l'obiettivo di mantenere la definizione il più semplice possibile, in modo che le prove (induttive) non debbano occuparsi di molti casi. Un'altra causa potrebbe essere che se consentiamo determinate operazioni, ma altre no, in alcuni casi risultano classi di lingue molto distinte (subregolari), ad esempio se consideriamo un'espressione regolare estesa senza l'operatore stella, otteniamo una sottoclasse corretta di quelle regolari , le cosiddette lingue senza stelle o aperiodiche, vedi Wikipedia: linguaggio senza stelle .
2) Se manteniamo gli articoli 1. - 6. ma modifichiamo semplicemente l'articolo 4. usando l'intersezione anziché l'unione, otteniamo una sottoclasse corretta delle lingue normali. Ad esempio, non potremmo più descrivere la lingua in quanto comporterebbe l'unione di e (vedere la prova di seguito). Se permettiamo la complementazione, le cose cambiano man mano che ci ricongiungiamo con le leggi di DeMorgan.{ a } { b }L={a,b}{a}{b}
3) Questo mi ha parzialmente risposto in 1), ma cosa intendi quando dici che questa definizione è preferita? Conosco definizioni in cui 2. è omesso (come abbiamo per 6. che ), oppure 3. è omesso (come abbiamo ∅ = L ( ¯ X ∗ )) o entrambi sono stati omessi; quindi questa non è la minima definizione possibile (ci dà anche un po 'di zucchero sintattico poiché abbiamo simboli extra per descrivere { ε } e ∅ ).L(∅∗)={ε}∅=L(X∗¯¯¯¯¯¯¯{ε}∅
EDIT : il mio primo commento citato in 2) era sbagliato, le lingue nella chiusura induttiva sotto , ∗ e ∩ non necessariamente sono sottoinsiemi di x ∗ per alcuni x ∈ X , ad esempio si consideri L ( a ∘ b ) = { a b } . Tuttavia abbiamo che L = { a , b } non può essere descritto da una tale espressione. Darò una prova, vale a dire la prova che se L = L ( R )∘*∩x*x ∈ XL ( a ∘ b ) = { a b}L = { a , b}L = L ( R)per qualche espressione con il 4 voci modificate, quindi se (e quindi un ≠ b )
{ un , b } ⊆ L ⇒ un b ∈ L .
La prova va per induzione sull'espressione R . Per il caso di base tiene vuoto, supponiamo ora che valga per L ( R 1 ) , L ( R 2 ) . Se L = L ( R 1 ∩X= { a , b }a ≠ b
{ Un , b } ⊆ L ⇒ un b ∈ L .
RL(R1) , L(R2) e
{ a , b } ⊆ L , quindi
{ a , b } ⊆ L ( R i ) , i = 1 , 2 quindi per ipotesi di induzione abbiamo
a b ∈ L ( R 1 ) ∩ L ( R 2 ) . Se
L = L (R1∩R2) = L (R1) ∩ L (R2){ a , b } ⊆ L{ a , b } ⊆ L ( Rio) , i = 1 , 2a b ∈ L ( R1) ∩ L ( R2) quindi come
a = a ⋅ ε = ε ⋅ a dobbiamo avere
un ∈ L ( R 1 ) e
ε ∈ L ( R 2 ) o viceversa. Supponiamo che il primo caso. Se
b ∈ L ({ a , b } ⊆ L ( R1∘ R2)=L(R1)L(R2)a=a⋅ε=ε⋅aa∈L(R1)ε∈L(R2) , quindi
a b ∈ L ( R 1 ) per ipotesi di induzione, quindi
a b = a b ⋅ ε ∈ L ( R 1 ) L ( R 2 ) . Supponiamo ora
b ∈ L ( R 2 ) , quindi abbiamo
a ⋅ b ∈ L ( R 2 ) L ( R 2 ) per definizione di
b∈L(R1)ab∈L(R1)ab=ab⋅ε∈L(R1)L(R2)b∈L(R2)a⋅b∈L(R2)L(R2) . Infine se
a , b ∈ L ( R ∗ 1 ) , quindi
a ∈ L ( R 1 ) n
e
b ∈ L ( R 2 ) m per alcuni
n , m > 0 . Se
n = m = 1 troviamo
a b ∈ L ( RL(R1)L(R2)a,b∈L(R∗1)a∈L(R1)nb∈L(R2)mn,m>0n=m=1 per ipotesi di induzione, quindi supponiamo
n > 1 , ma questo dà
a ∈ L ( R 1 ) , simile o
m = 1 o
m > 1 dà
b ∈ L ( R 1 ) e l'ipotesi di induzione dà
a b ∈ L ( R 1 ) ⊆ L ( R ∗ 1 ) .
◻ab∈L(R1)n>1a ∈ L ( R1)m = 1m > 1b ∈ L ( R1)a b ∈ L ( R1) ⊆ L ( R*1)□
Nota: una conclusione comunemente usata: se , allora u = a o w = a . Questo segue come 1 = | a | = | u w | = | u | + | w | , quindi | u | = 0 e | w | = 1 o | u | = 1 e | w | =a=uwu = aw = a1 = | a | = | u w | = | u | + | w || u | =0| w | =1| u | =1 . Nel primo caso abbiamo u = ε e quindi a = w .| w | =0u = εa = w