Peggior numero di domande necessarie per imparare un predicato monotonico su un poset


15

Considera un poset finito su elementi e un predicato monotonico sconosciuto su (cioè, per qualsiasi , , se e quindi ) . Posso valutare fornendo un nodo e scoprendo se valido o meno. Il mio obiettivo è determinare esattamente l'insieme dei nodi modo che valga, usando come poche valutazioni di(X,)nPXxyXP(x)xyP(y)PxXP(x)xXP(x)Pil più possibile. (Posso scegliere le mie query in base alla risposta di tutte le query precedenti, non sono tenuto a pianificare tutte le query in anticipo.)

Una strategia over è una funzione che mi dice, in funzione delle query che ho eseguito finora e delle loro risposte, su quale nodo interrogare e che assicura che su qualsiasi predicato , seguendo la strategia , Raggiungerò uno stato in cui conosco il valore di su tutti i nodi. Il tempo di esecuzione di su un predicato è il numero di query richieste per conoscere il valore di su tutti i nodi. Il peggior tempo di esecuzione di è . Una strategia ottimale S ' è tale che wr (S') = \ min_S wr (S) .S(X,)PPr(S,P)SPPSwr(S)=maxPr(S,P)Swr(S)=minSwr(S)

La mia domanda è la seguente: dato come input il poset (X,) , come posso determinare il peggior tempo di esecuzione delle strategie ottimali?

[È chiaro che per un poset vuoto saranno necessarie n query (dobbiamo chiedere di ogni singolo nodo) e che per un ordine totale saranno necessarie query log2n (facendo una ricerca binaria per trovare la frontiera). Un risultato più generale è il seguente limite inferiore teorico delle informazioni: il numero di possibili scelte per il predicato P è il numero NX di antichain di (X,) (perché esiste un mapping uno a uno tra predicati monotonici e gli antichain interpretati come gli elementi massimi di P ), quindi, poiché ogni query ci fornisce un po 'di informazioni, avremo bisogno almeno di log2NXinterrogazioni, riassumendo i due casi precedenti. Questo è stretto, o sono alcuni poset la cui struttura è tale che l'apprendimento può richiedere asintoticamente più domande rispetto al numero di antichain?]


2
In cosa differisce dalla tua precedente domanda su questo argomento? cstheory.stackexchange.com/questions/14772/…
Suresh Venkat,

1
D'accordo, è simile, ma sono interessato ai poset generali qui, compresi i poset di piccola larghezza che non assomigliano affatto al reticolo completo. Inoltre, non mi interessa più della complessità incrementale o qualcosa del genere, solo per il numero di query richieste in funzione della scelta del poset. In questa impostazione l'interpretazione della funzione booleana non è applicabile e sembra davvero che la risposta dipenda in qualche modo dalla "struttura" del poset (forse il numero di antichain, come ho suggerito). Spero che questo meriti una domanda separata, per favore chiudi se ho sbagliato.
a3nm,

1
Cordiali saluti, nella letteratura sulla complessità, le strategie come le hai definite sono in genere chiamate "alberi decisionali" e hanno una nozione standard di altezza (la misura che ti interessa) e dimensioni.
Joshua Grochow,

Grazie Giosuè! Ne sono più o meno consapevole, ho solo pensato che fosse più semplice usare il vocabolario della teoria dei giochi, ma sì, sono consapevole che la strategia può essere vista come un albero.
a3nm,

1
(Nessun problema. A proposito, non stavo solo sottolineando che può essere visto come un albero. Il modo in cui lo hai descritto è davvero molto semplice e chiaro, ma ti stavo fornendo una parola chiave / termine d'arte che potresti essere in grado di cercare, oltre a un termine che è probabilmente immediatamente familiare a molte persone che frequentano questo sito. Saluti!)
Joshua Grochow,

Risposte:


7

Questa non è una risposta completa, ma è troppo lungo per essere un commento.

Penso di aver trovato un esempio per cui il limite non è stretto.log2NX

Considera il seguente poset. Il set di terra è e a i è più piccolo di b j per tutti i , j { 1 , 2 } . Le altre coppie sono incomparabili. (Il diagramma di Hasse è un 4 cicli).X={a1,a2,b1,b2}aibji,j{1,2}4

Permettetemi di identificare le proprietà monotone con gli sconvolgimenti del poset. Questo poset ha sette turni: , { b 1 } , { b 2 } , { b 1 , b 2 } , { a 1 , b 1 , b 2 } , { a 2 , b 1 , b 2 } , { a 1 , a 2 , b 1 ,{b1}{b2}{b1,b2}{a1,b1,b2}{a2,b1,b2} , e questo poset ha sette antichain poiché gli antichain sono in corrispondenza uno a uno con gli sconvolgimenti. Quindi,log 2 N X= log 2 7 = 3 per questo poset.{a1,a2,b1,b2}log2NX=log27=3

Ora, per argomento avverso, mostrerò che qualsiasi strategia ha bisogno di almeno quattro query (quindi deve interrogare tutti gli elementi). Risolviamo una strategia arbitraria.

Se la strategia richiede prima , l'avversario risponde " P ( a 1 ) non regge". Quindi, ci rimangono cinque possibilità: , { b 1 } , { b 2 } , { b 1 , b 2 } , { a 2 , b 1 , b 2 } . Pertanto, per determinare quale sia il caso, è necessario almeno log 2 5 = 3a1P(a1){b1}{b2}{b1,b2}{a2,b1,b2}log25=3più domande. In totale, abbiamo bisogno di quattro domande. Lo stesso argomento si applica se la prima query è .a2

Se la strategia richiede prima , l'avversario risponde " P ( b 1 ) vale". Quindi, ci rimangono cinque possibilità: { b 1 } , { b 1 , b 2 } , { a 1 , b 1 , b 2 } , { a 2 , b 1 , b 2 } , { a 1 , a 2 , bb1P(b1){b1}{b1,b2}{a1,b1,b2}{a2,b1,b2} . Pertanto, abbiamo bisogno di almeno altre tre query come prima. In totale, abbiamo bisogno di quattro domande. Lo stesso argomento si applica quando la prima query è b 2 .{a1,a2,b1,b2}b2

Se prendiamo copie parallele di questo poset, allora ha 7 k antichain, e quindi il limite proposto è log 2 7 k= 3 k . Tuttavia, poiché ciascuna delle copie richiede quattro query, sono necessarie almeno 4 k query.k7klog27k=3k4k

Probabilmente, c'è un poset più grande con uno spazio maggiore. Ma questo argomento può solo migliorare il coefficiente.

Qui, il problema sembra essere una situazione in cui nessuna query suddivide uniformemente lo spazio di ricerca. In tal caso, l'avversario può costringere la metà più grande a rimanere.


1
Ah, interessante. Generalizzando il tuo esempio a , è chiaro che se la risposta è i , ¬ P ( a i ) e i , P ( b i ) , non lo sapremo con certezza fino a quando non verranno interrogati tutti i 2 n nodi. Tuttavia, ci sono 2 nX={a1,...,an,b1,...,bn}i,¬P(ai)i,P(bi)2nantichain ( 2 n -1sottoinsiemi non vuoti di a i , idem per b i e set vuoto), quindi il limite non è stretto di un fattore 2. Grazie per questo esempio. Tuttavia, non vedo davvero come / se il gap potrebbe essere più di un fattore moltiplicativo, o se è possibile trovare un limite superiore non banale, per non parlare di un algoritmo per una risposta esatta. 2n+112n1aibi
a3nm

7

Nel loro articolo Ogni Poset ha un elemento centrale , Linial e Saks mostrano (Teorema 1) che il numero di query richieste per risolvere il problema di identificazione ideale in un poset è al massimo K 0 log 2 i ( X ) , dove K 0 = 1 / ( 2 - log 2 ( 1 + log 2 5 ) ) e I ( X ) è il numero di ideali di X . Quello che chiamano un "ideale" è in realtà un insieme inferioreXK0log2i(X)K0=1/(2log2(1+log25))i(X)Xe c'è un'ovvia corrispondenza uno a uno tra predicati monotonici e l'insieme inferiore dei punti in cui non trattengono, inoltre il loro "problema di identificazione" è quello di identificare interrogando i nodi proprio come nella mia impostazione, quindi penso che siano affrontare il problema che mi interessa e che .i(X)=NX

Quindi, secondo il loro risultato, il limite inferiore teorico dell'informazione è strettamente legato a una costante moltiplicativa relativamente piccola. Quindi questo si deposita in fondo alla questione del numero delle domande richieste, in funzione di e fino ad una costante moltiplicativa: è tra i log 2 N X e K 0 log 2 N X .NXlog2NXK0log2NX

Linial e Saks citano una comunicazione personale di Shearer per dire che esistono ordini noti per i quali possiamo dimostrare un limite inferiore di per un po 'di K 1 che è appena leggermente inferiore a K 0 (questo è nello spirito di La risposta di Yoshio Okamoto che ha provato questo approccio per un valore inferiore di K 1 ).K1log2NXK1K0K1

Questo non risponde pienamente alla mia domanda di calcolare il numero di domande richieste da , tuttavia, poiché calcolare N X da X è # P-completo , ho la sensazione che ci sia poca speranza. (I commenti su questo punto sono ben accetti.) Tuttavia, questo risultato di Linial e Saks è illuminante.XNXX


5

Per il cubo n booleano (o, equivalentemente, per il poset ( 2 S , ) di tutti i sottoinsiemi di un insieme di elementi n), la risposta è data dai teoremi di Korobkov e Hansel (rispettivamente dal 1963 e 1966). Il teorema di Hansel [1] afferma che una funzione booleana monotona sconosciuta (cioè un predicato monotono sconosciuto su questo poset) può essere appresa da un algoritmo deterministico che produce al massimo ϕ ( n ) = ( n({0,1}n,)(2S,) query (ovvero, porreϕ(n)domande nel caso peggiore). Questo algoritmo corrisponde al limite inferiore del teorema di Korobkov [2], che dice cheϕ(n)-1query non sono sufficienti. (Quindi l'algoritmo di Hansel è ottimale nel caso peggiore.) Un algoritmo in entrambe le affermazioni è inteso come un albero decisionale deterministico.ϕ(n)=(nn/2)+(nn/2+1)ϕ(n)ϕ(n)1

Il logaritmo del numero di antichain in è asintoticamente uguale a ( n({0,1}n,) , quindi esiste un gap di fattore costante tralogNXe le prestazioni ottimali dell'algoritmoϕ(n)2 ( n(nn/2)2n/πn/2logNX per questo poset.ϕ(n)2(nn/2)

Sfortunatamente, non sono stato in grado di trovare un buon trattamento dell'algoritmo di Hansel in inglese disponibile sul web. Si basa su un lemma che suddivide il cubo n in catene con proprietà speciali. Qualche descrizione può essere trovata in [3]. Per il limite inferiore, non conosco alcun riferimento a una descrizione in inglese.ϕ(n)

Dato che ho familiarità con questi risultati, posso pubblicare una descrizione su arXiv, se il trattamento nel documento di Kovalerchuk non è sufficiente.

Se non sbaglio molto, ci sono stati tentativi di generalizzare l'approccio di Hansel, almeno per il poset , dove ( E k , ) è una catena 0 < 1 < < k - 1 , anche se I non è possibile fornire immediatamente alcun riferimento. Nel caso booleano, le persone hanno anche studiato nozioni di complessità diverse dal caso peggiore per questo problema.(Ekn,)(Ek,)0<1<<k1

[1] G. Hansel, Sur la nombre des fonctions booléennes monotones de n variabili. CR Acad. Sci. Parigi, 262 (20), 1088-1090 (1966)

[2] VK Korobkov. Stima del numero di funzioni monotoniche dell'algebra della logica e della complessità dell'algoritmo per trovare l'insieme risolutivo di una funzione monotonica arbitraria dell'algebra della logica. Matematica Sovietica. Doklady 4, 753-756 (1963) (traduzione dal russo)

[3] B. Kovalerchuk, E. Triantaphyllou, AS Deshpande, E. Vityaev. Apprendimento interattivo di funzioni booleane monotone. Information Sciences 94 (1), 87-118 (1996) ( link )


Grazie mille per questa risposta dettagliata! Per il -cube booleano , consultare < cstheory.stackexchange.com/q/14772 >. Riesco a leggere il francese ma non riesco a trovare il documento di Hansel (avrebbe dovuto essere disponibile su Gallica ma questo problema sembra mancare), ho trovato informazioni pertinenti in Sokolov, NA (1982), "Sulla valutazione ottimale delle funzioni booleane monotoniche", USSR Comput Math Math Phys, Vol 22, No 2, 207-220 (esiste la traduzione in inglese). Sono interessato a generalizzazioni ad altri DAG se riesci a trovare riferimenti. Non esitate a rispondere via e-mail (a3nm AT a3nm DOT net) se il limite di lunghezza è un problema. Grazie ancora! n
a3nm,

Prego! Sfortunatamente, non so come limitare il tempo di esecuzione dell'algoritmo in termini di dimensioni dell'output. La prova di Korobkov del limite inferiore, ad esempio, non fornisce una risposta a tale domanda. Tuttavia, ritengo che potrebbe esserci un riferimento leggermente rilevante. Cercherò di trovare un po 'di tempo durante il fine settimana e cercherò anche generalizzazioni. Allo stesso tempo, non sono sicuro che valga la pena scrivere una descrizione inglese chiusa del caso booleano (questi due teoremi) ...
gg

@ a3nm forse il caso DAG non è stato preso in considerazione in letteratura? potrebbe essere più difficile del cubo n booleano ordinato per inclusione?
vzn

@vzn Immagino che almeno alcune delle domande qui siano destinate ad essere aperte. Anche per una catena, non è immediatamente chiaro come generalizzare l'algoritmo di Hansel.
dd1,

@ a3nm sembra tutto simile a trovare limiti inferiori / circuiti monotoni minimi (dimensioni) ma non l'ho mai visto chiaramente collegato finora ...
vzn

0

[ NOTA: il seguente argomento non sembra funzionare, ma lo lascio qui in modo che altri non commettano lo stesso errore / nel caso in cui qualcuno possa risolverlo. Il problema è che un limite esponenziale inferiore all'apprendimento / identificazione di una funzione monotona, come di seguito, non contraddice necessariamente un algoritmo polinomiale incrementale per il problema. Ed è quest'ultimo che equivale a verificare la dualità reciproca di due funzioni monotone nel poli-tempo.]

Credo che la tua congettura sul sia falsa in generale. Se effettivamente sono necessarie query log N X , ciò implica un limite inferiore piuttosto forte all'apprendimento delle funzioni monotone mediante le query di appartenenza . In particolare, lasciare che il poset X sia il cubo booleano con il solito ordine (se vi piace, X è il Powerset di { 1 , . . . , N } con come il suo ordine parziale). Il numero M di anacidi massimi in X soddisfa il log M =logNXlogNXXX{1,...,n}MX [1]. Se la tua idea sulregistroNXè corretta, allora c'è un predicato monotono suXche richiede essenzialmente ( n-1logM=(1+o(1))(n1n/2)logNXXquery. In particolare, ciò implica un limite inferiore di essenzialmente2nper la complessità di qualsiasi algoritmo che risolve questo problema.(n1n/2)2n2n

Tuttavia, se ho capito correttamente [ che ora so di non averlo ], il tuo problema equivale a verificare la dualità reciproca di due funzioni monotone, che può essere eseguita in un tempo quasi polinomiale (vedi l'introduzione di questo documento di Bioch e Ibaraki , che cita Fredman e Khachiyan), contraddicendo qualsiasi cosa vicina ad un limite inferiore di .2n

[1] Liviu Ilinca e Jeff Kahn. Conteggio dei massimi antichain e set indipendenti . arXiv: 1202.4427


Josh, non vedo un problema con l' argomento la mia comprensione è che è aperto se una funzione monotona può essere appresa nel tempo polinomiale in n e il numero di elementi minimi. l'articolo di Bioch-Ibaraki parla dell'algoritmo polinomiale incrementalelogNXn
Sasho Nikolov,

Ah ok. Non ne ero a conoscenza. (Come ho detto, non sono un esperto in questo settore - la mia risposta è stata basata solo sulla ricerca di alcune cose e sul metterle insieme.) Lascerò qui in modo che altre persone possano vederlo e almeno non fare il stesso errore / nella migliore delle ipotesi trasformalo in qualcosa di utile.
Joshua Grochow,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.