Tecniche per invertire l'ordine dei quantificatori

73

È noto che, in generale, l'ordine dei quantificatori universali ed esistenziali non può essere invertito. In altre parole, per una formula logica generale , $\phi(\cdot,\cdot)$

$(\forall x)(\exists y) \phi(x,y) \quad \not\Leftrightarrow \quad (\exists y)(\forall x) \phi(x,y)$

D'altra parte, sappiamo che il lato destro è più restrittivo del lato sinistro; cioè, $(\exists y)(\forall x) \phi(x,y) \Rightarrow (\forall x)(\exists y) \phi(x,y)$ .

Questa domanda si concentra sulle tecniche per derivare $(\forall x)(\exists y) \phi(x,y) \Rightarrow (\exists y)(\forall x) \phi(x,y)$ , ogni volta che vale per $\phi(\cdot,\cdot)$ .

La diagonalizzazione è una di queste tecniche. Vedo per la prima volta questo uso della diagonalizzazione nel documento Relativizzazioni della domanda $\mathcal{P} \overset{?}{=} \mathcal{NP}$ (vedi anche la breve nota di Katz ). In quel documento, gli autori dimostrano innanzitutto che:

Per ogni macchina oracolare M deterministica, a tempo polinomiale, esiste un linguaggio B tale che $L_B \ne L(M^B)$ .

Invertono quindi l'ordine dei quantificatori (usando la diagonalizzazione ), per dimostrare che:

Esiste un linguaggio B tale che per tutto il deterministico, poli-tempo M abbiamo . $L_B \ne L(M^B)$

Questa tecnica è utilizzata in altri articoli, come [CGH] e [AH] .

Ho trovato un'altra tecnica nella dimostrazione del Teorema 6.3 di [IR] . Usa una combinazione di teoria della misura e principio del buco del piccione per invertire l'ordine dei quantificatori.

Voglio sapere quali altre tecniche sono utilizzate in informatica, per invertire l'ordine dei quantificatori universali ed esistenziali?

lo.logic big-picture proof-techniques

— MS Dousti
fonte

14

Caspita, questa è un'ottima domanda. La sola lettura mi ha fatto guardare gli oggetti "familiari" in modo diverso. Grazie!

— Mark Reitblatt il

68

L'inversione dei quantificatori è una proprietà importante che è spesso alla base di teoremi ben noti.

Ad esempio, in analisi la differenza tra e è la differenza tra continuità puntuale e uniforme . Un teorema ben noto afferma che ogni mappa continua puntuale è uniformemente continua, a condizione che il dominio sia bello, cioè compatto . $\forall \epsilon > 0 . \forall x . \exists \delta > 0$ $\forall \epsilon > 0 . \exists \delta > 0 . \forall x$

In effetti, la compattezza è al centro dell'inversione dei quantificatori. Considerare due Datatypes e di cui è palese e è compatto (vedi sotto per la spiegazione di questi termini), e lasciate sia una relazione semidecidibili tra e . L'istruzione può essere letto come segue: ogni punto in è coperto da alcuni . Poiché gli insiemi sono "computably open" (semidecidable) e $X$ $Y$ $X$ $Y$ $\phi(x,y)$ $X$ $Y$ $\forall y : Y . \exists x : X . \phi(x,y)$ $y$ $Y$ $U_x = \lbrace z : Y \mid \phi(x,z) \rbrace$ $U_x$ $Y$ è compatto esiste un sottofondo finito. Abbiamo dimostrato che implica Spesso possiamo ridurre l'esistenza dell'elenco finito a una singola . Ad esempio, se è ordinato in modo lineare e è monotono in rispetto all'ordine, allora possiamo prendere per essere il più grande di .

\forall y : Y . \exists x : X . ϕ (x, y)

$\forall y : Y . \exists x : X . \phi(x,y)$

\exists x_{1}, \dots, x_{n} : X . \forall y : Y . ϕ (x_{1}, y) \lor \dots \lor ϕ (x_{n}, y) .

$\exists x_1, \ldots, x_n : X . \forall y : Y . \phi(x_1,y) \lor \cdots \lor \phi(x_n, y).$

x_{1}, \dots, x_{n}

$x_1, \ldots, x_n$

x

$x$

X

$X$

ϕ

$\phi$

x

$x$

x

$x$

x_{1}, \dots, x_{n}

$x_1, \ldots, x_n$

Per vedere come questo principio viene applicato in un caso familiare, osserviamo l'affermazione che è una funzione continua. Manteniamo come variabile libera per non confonderci con un quantificatore universale esterno: Poiché è compatto e il confronto dei reali è semidecidibile, l'istruzione è semidecidabile. I reali positivi sono palesi e è compatto, quindi possiamo applicare il principio: $f : [0,1] \to \mathbb{R}$ $\epsilon > 0$

\forall x \in [0, 1] . \exists δ > 0 . \forall y \in [x - δ, x + δ] . | f (y) - f (x) | < ϵ .

$\forall x \in [0,1] . \exists \delta > 0 . \forall y \in [x - \delta, x + \delta] . |f(y) - f(x)| < \epsilon.$

[x - δ, x + δ]

$[x - \delta, x + \delta]$

ϕ (x, δ) \equiv \forall y \in [x - δ, x + δ] . | f (y) - f (x) | < ϵ

$\phi(x, \delta) \equiv \forall y \in [x - \delta, x + \delta] . |f(y) - f(x)| < \epsilon$

[0, 1]

$[0,1]$

\exists δ_{1}, δ_{2}, \dots, δ_{n} > 0 . \forall x \in [0, 1] . ϕ (δ_{1}, x) \lor \dots ϕ (δ_{n}, x) .

$\exists \delta_1, \delta_2, \ldots, \delta_n > 0 . \forall x \in [0,1] . \phi(\delta_1, x) \lor \cdots \phi(\delta_n, x).$ Poiché è antimonotone in il più piccolo di fa già il lavoro, quindi ne abbiamo bisogno solo uno : Ciò che abbiamo è la continuità uniforme di .

ϕ (δ, x)

$\phi(\delta, x)$

δ

$\delta$

δ_{1}, \dots, δ_{n}

$\delta_1, \ldots, \delta_n$

δ

$\delta$

\exists δ > 0 . \forall x \in [0, 1] . \forall y \in [x - δ, x + δ] . | f (y) - f (x) | < ϵ .

$\exists \delta > 0 . \forall x \in [0,1] . \forall y \in [x - \delta, x + \delta] . |f(y) - f(x)| < \epsilon.$

f

$f$

In termini vaghi, un tipo di dati è compatto se ha un quantificatore universale calcolabile e evidente se ha un quantificatore esistenziale calcolabile. Gli interi (non negativi) sono palesi perché al fine di stabilire se , con semidecidabile, eseguiamo la ricerca parallela a coda di rondine . Lo spazio Cantor è compatto e palese, come spiegato dalla Dual Stone astratta di Paul Taylor e dalla " Topologia sintetica di tipi di dati e spazi classici " di Martin Escardo (vedi anche la nozione correlata di spazi ricercabili ). $\mathbb{N}$ $\exists n \in \mathbb{N} . \phi(n)$ $\phi(n)$ $2^\mathbb{N}$

Applichiamo il principio all'esempio che hai citato. Vediamo una lingua come una mappa da parole (finite) su un alfabeto fisso a valori booleani. Poiché le parole finite sono in corrispondenza biiettiva calcolabile con numeri interi, possiamo vedere una lingua come una mappa da numeri interi a valori booleani. Cioè, il tipo di dati di tutte le lingue è, fino all'isomorfismo calcolabile, precisamente lo spazio di Cantor nat -> bool, o nella notazione matematica , che è compatto. Una macchina di Turing a tempo polinomiale è descritta dal suo programma, che è una stringa finita, quindi lo spazio di tutte le (rappresentazioni di) macchine di Turing può essere considerato o , che è palese. $2^\mathbb{N}$ nat $\mathbb{N}$

Data una macchina di Turing e un linguaggio , l'istruzione che dice "il linguaggio è rifiutato da " è semidecidibile perché in realtà è decidibile: basta eseguire con input e vedere cosa lo fa. Le condizioni per il nostro principio sono soddisfatte! L'affermazione "ogni macchina oracolo ha un linguaggio tale che non è accettato da " è scritta simbolicamente come Dopo l'inversione dei quantificatori otteniamo $M$ $c$ $\mathsf{rejects}(M,c)$ $c$ $M$ $M$ $c$ $M$ $b$ $b$ $M^b$

\forall M : N . \exists b : 2^{N} . r e j e c t s (M^{b}, b) .

$\forall M : \mathbb{N} . \exists b : 2^\mathbb{N} . \mathsf{rejects}(M^b,b).$

\exists b_{1}, \dots, b_{n} : 2^{N} . \forall M : N . r e j e c t s (M^{b_{1}}, b_{1}) \lor \dots \lor r e j e c t s (M^{b_{n}}, b_{n}) .

$\exists b_1, \ldots, b_n : 2^\mathbb{N} . \forall M : \mathbb{N} . \mathsf{rejects}(M^{b_1}, b_1) \lor \cdots \lor \mathsf{rejects}(M^{b_n},b_n).$ Ok, quindi siamo finiti in molte lingue. Possiamo combinarli in un unico? Lo lascerò come esercizio (per me e te!).

Potresti anche essere interessato alla domanda leggermente più generale su come trasformare a un'istruzione equivalente del modulo o viceversa. Esistono diversi modi per farlo, ad esempio: $\forall x . \exists y . \phi(x,y)$ $\exists u . \forall v . \psi(u,v)$

— Andrej Bauer
fonte

4

È una condizione molto generale (uno spazio deve essere palese, l'altro compatto e la relazione aperta), ma è anche una tecnica: se riesci a trovare topologie che soddisfano le condizioni, puoi invertire i quantificatori.

— Andrej Bauer,

8

@Andrej, la tua risposta è davvero buona ed educativa. Non ho mai saputo che ci fosse una relazione tra compattezza e quantificatori di inversione, fino a quando non appare questo post. Mi sento illuminato.

— Hsien-Chih Chang 張顯之

8

Che risposta incredibile.

— Suresh Venkat,

10

Mi sento lusingato. Vorrei che più persone conoscessero le intime connessioni tra logica, calcolo e topologia.

— Andrej Bauer,

6

@Andrej: esiste un buon riferimento (specialmente un libro o una nota di lezione) sulle "connessioni intime tra logica, calcolo e topologia"?

— MS Dousti,

25

Il lemma del set hard-core di Impagliazzo consente di cambiare quantificatori nel contesto delle ipotesi di durezza computazionale. Ecco il documento originale . Puoi trovare tonnellate di articoli e articoli correlati su Google.

Il lemma dice che se per ogni algoritmo A esiste una grande serie di input su cui A non riesce a calcolare una funzione fissa f, allora in realtà esiste una grande serie di input su cui ogni algoritmo non riesce a calcolare f con probabilità prossima a 1 / 2.

Questo lemma può essere dimostrato usando il teorema o il potenziamento min-max (una tecnica della teoria dell'apprendimento computazionale), entrambi esempi di commutazione dei quantificatori.

— Manu
fonte

3

Questo è un punto eccellente.

— Suresh Venkat,

17

Per me, la dimostrazione "canonica" del teorema di Karp-Lipton (che ) ha questo sapore. Ma qui non è l'effettiva affermazione del teorema in cui i quantificatori vengono invertiti, ma piuttosto i "quantificatori" vengono invertiti all'interno del modello di calcolo alternato, usando l'assunto che abbia piccoli circuiti. $NP \subseteq P/poly \Longrightarrow \Pi_2 P = \Sigma_2 P$ $NP$

Vuoi simulare un calcolo del modulo

$(\forall y)(\exists z)R(x,y,z)$

dove è un predicato del tempo polinomiale. Puoi farlo indovinando un piccolo circuito per (diciamo) soddisfacibilità, modificando modo che controlli se stesso e produca un incarico soddisfacente quando il suo input è soddisfacente. Quindi, per tutti , creare un'istanza SAT equivalente a e risolverlo. Quindi hai prodotto un calcolo equivalente del modulo $R$ $C$ $C$ $y$ $S(x,y)$ $(\exists z)R(x,y,z)$

$(\exists C)(\forall y)[S(x,y)$ è soddisfacente secondo . $C]$

— Ryan Williams
fonte

Eccezionale! Questo è un esempio di commutazione del quantificatore basato sul presupposto.

— MS Dousti,

Anche se questo è perfettamente corretto, ho voluto suggerire di scrivere invece di , poiché NP non può mai eguagliare P / poly.

N P \subset P / p o l y

$NP \subset P/poly$

N P \subseteq P / p o l y

$NP \subseteq P/poly$

— MS Dousti,

12

L'uso di base dell'unione vincolata nel metodo probabilistico può essere interpretato come un modo per invertire l'ordine dei quantificatori. Anche se questo è già menzionato implicitamente nella domanda perché la dimostrazione di Impagliazzo e Rudich ne è un esempio, penso che valga la pena dichiararlo in modo più esplicito.

Supponiamo che X sia finito e che per ogni x ∈ X , sappiamo non solo che alcuni y ∈ Y soddisfano φ ( x , y ) ma anche che molte scelte di y ∈ Y soddisfano φ ( x , y ). Formalmente, supponiamo che conosciamo (∀ x ∈ X ) Pr _{y ∈ Y} [￢φ ( x , y )] <1 / | X | per qualche misura probabilistica su Y. Quindi il limite dell'unione ci consente di concludere Pr _{y ∈ Y} [(∃ x ∈ X ) ￢φ ( x , y )] <1, che equivale a (∃ y ∈ Y ) (∀ x ∈ X ) φ ( x , y ).

Esistono variazioni di questo argomento:

Se X è infinito, a volte possiamo discretizzare X considerando una metrica adatta su X e una sua rete ε . Dopo aver discretizzato X , possiamo usare il sindacato come sopra.
Quando gli eventi φ ( x , y ) per diversi valori di x sono quasi indipendenti, possiamo usare il lemma locale di Lovász invece del limite di unione.

— Tsuyoshi Ito
fonte

2

Tsuyoshi, questo è terribilmente fuori tema, ma è tempo di nominarti moderatore :)

— Suresh Venkat,

10

Vorrei aggiungere molte altre tecniche. Sebbene le prime due tecniche non siano esattamente per invertire l'ordine dei quantificatori universali ed esistenziali, hanno un sapore molto simile. Pertanto, ho colto l'occasione per descriverli qui:

Lemma della media: usato per dimostrare e molti altri teoremi interessanti. Informalmente , supporre che denota l'insieme di abbonati a qualche biblioteca, denota l'insieme di libri in biblioteca, e per e , la proposizione è vero se e solo se "abbonato piace il libro . " Il lemma medio afferma che: se per ogni , esistono almeno 2/3 di 's in tale che vale, allora esiste un singolo $BPP \subset P/poly$ $S$ $B$ $s\in S$ $b \in B$ $\phi(s,b)$ $s$ $b$ $s \in S$ $b$ $B$ $\phi(s,b)$ $b \in B$ , tale che per almeno i 2/3 di in , vale la proposizione . (Ciò può essere facilmente dimostrato tramite reductio ad absurdum e un argomento di conteggio.) $s$ $S$ $\phi(s,b)$

Ora lasciate , e lasciare che essere una macchina PPT che decide . Supponiamo che il tempo di esecuzione di sia limitato da un polinomio . Quindi, per qualsiasi e per almeno 2/3 di 's, , esso sostiene che . Qui, è la macchina che utilizza casualità , e è la funzione caratteristica di . Il lemma della media viene quindi usato per mostrare che per qualsiasi $L \in BPP$ $M(\cdot)$ $L$ $M$ $q(\cdot)$ $x \in \{0,1\}^*$ $r$ $r \in \{0,1\}^{q(|x|)}$ $M_r(x) = \chi_L(x)$ $M_r(\cdot)$ $M$ $r$ $\chi_L(\cdot)$ $L$ $n \in \mathbb{N}$ , esiste un singolo , tale che per almeno 2/3 di 's di lunghezza , . Questa singola funziona come un consiglio per , e quindi . $r \in \{0,1\}^{q(n)}$ $x$ $n$ $M_r(x) = \chi_L(x)$ $r$ $M$ $BPP \subset P/poly$

NOTE: I re-emphasize that this is not a quantifier switching technique, but it has the same spirit.

Scambio di Lemma: Zachos e Fürer hanno introdotto un nuovo quantificatore probabilistico (che significa approssimativamente "per la maggior parte"). Lo hanno dimostrato (omettendo i dettagli): $\exists^+$

$(\forall y)(\exists^+z) \phi(x,y,z) \Rightarrow (\exists^+ \mathbf{C})(\forall y)(\exists z \in \mathbf{C})\phi(x,y,z)$

Si noti che questo è un teorema della logica di secondo ordine.

Usando il lemma di scambio, dimostrarono una serie di teoremi interessanti, come il teorema BPP e il teorema Babai . Ti rimando al documento originale per ulteriori informazioni. $MA \subseteq AM$

Un teorema simile a Karp-Lipton teorema di cui Ryan Williams postale: . $coNP \subset NP/Poly \Longrightarrow \Pi_3 P = \Sigma_3 P$

— MS Dousti
fonte

Nitpicking: Vorrei sottolineare che la prova effettiva di BPP⊆P / poly richiede un po 'più di quello che è scritto qui, perché una stringa di consigli che funziona solo per 2/3 della frazione di istanze è insufficiente. Ma penso che il punto importante della prima metà di questa risposta sia che la prova di BPP⊆P / poly può essere vista come qualcosa di simile all'inversione dei quantificatori, che è perfettamente valida.

— Tsuyoshi Ito,

@Tsuyoshi: hai ragione. Ma il resto della prova usa la ripetizione sequenziale e il limite di Chernoff, per dimostrare l'esistenza di una che funziona per tutti tranne una frazione esponenzialmente piccola di input; e come hai detto, ciò non ha a che fare con l'inversione dei quantificatori, quindi l'ho omesso.

r

$r$

— MS Dousti,

Non sono sicuro che tu abbia capito il mio punto. Il mio punto è che l'affermazione del "lemma medio" non è sufficiente per dimostrare BPP⊆P / poly. È necessaria una stima leggermente più fine, vale a dire la stima della probabilità attesa E_b [Pr_s φ (s, b)] anziché max_b [Pr_s φ (s, b)].

— Tsuyoshi Ito,

@Tsuyoshi: temo di non averti preso. Nel commento precedente, ho notato che per prima cosa amplifichiamo l'errore 1/3 a , quindi applichiamo il lemma della media. Ecco una prova completa, tratta dal libro di Goldreich. Mi sto perdendo qualcosa?

2^{- | x |}

$2^{-|x|}$

— MS Dousti,

Grazie! Avevo frainteso il tuo commento. Non sapevo che BPP⊆P / poly potesse essere provato riducendo prima l'errore e poi applicando il lemma della media (stavo pensando all'ordine opposto).

— Tsuyoshi Ito,