Caratterizzazione combinatoria dell'apprendimento esatto con domande di appartenenza


15

Modifica: poiché non ho ricevuto risposte / commenti da una settimana, vorrei aggiungere che sono felice di sapere qualcosa sul problema. Non lavoro nell'area, quindi anche se si tratta di una semplice osservazione, potrei non saperlo. Anche un commento del tipo "Lavoro nell'area, ma non ho visto una caratterizzazione come questa" sarebbe utile!

Sfondo:

Esistono diversi modelli di apprendimento ben studiati nella teoria dell'apprendimento (ad esempio, apprendimento PAC, apprendimento online, apprendimento esatto con domande di appartenenza / equivalenza).

Ad esempio, nell'apprendimento PAC, la complessità del campione di una classe di concetti ha una bella caratterizzazione combinatoria in termini di dimensione VC della classe. Quindi, se vogliamo imparare una classe con precisione e sicurezza costanti, questo può essere fatto con Θ(d) campioni, dove d è la dimensione VC. (Si noti che stiamo parlando della complessità del campione, non della complessità del tempo.) Esiste anche una caratterizzazione più raffinata in termini di accuratezza e sicurezza. Allo stesso modo, il modello di apprendimento online associato agli errori ha una bella caratterizzazione combinatoria.

Domanda:

Voglio sapere se un risultato simile è noto per il modello di apprendimento esatto con le domande di iscrizione. Il modello è definito come segue: abbiamo accesso a una casella nera che sull'input x ti dà f(x) . Sappiamo f proviene da un qualche concetto di classe C . Vogliamo determinare f con il minor numero di query possibile.

Esiste un parametro combinatorio di un concetto di classe C che caratterizza il numero di query necessarie per apprendere un concetto nel modello di apprendimento esatto con le domande di appartenenza?

Quello che so:

La migliore caratterizzazione che ho trovato è in questo articolo di Servedio e Gortler , usando un parametro a cui attribuiscono Bshouty, Cleve, Gavaldà, Kannan e Tamon . Definiscono un parametro combinatorio chiamato , dove C è la classe concettuale, che ha le seguenti proprietà. (Consenti a Q C di essere il numero ottimale di query necessarie per apprendere C in questo modello.)γCCQCC

QC=Ω(1/γC)QC=Ω(log|C|)QC=O(log|C|/γC)

Questa caratterizzazione è quasi serrata. Tuttavia, potrebbe esserci un divario quadratico tra i limiti superiore e inferiore. Ad esempio se , quindi il limite inferiore è Ω ( k ) , ma il limite superiore è O ( k 2 )1/γC=log|C|=kΩ(k)O(k2) . (Penso anche che questo divario sia realizzabile, cioè esiste una classe di concetti per cui i limiti inferiori sono entrambi , ma il limite superiore è O ( k 2 ) .)Ω(k)O(k2)


1
"Dimensione Haystack" caratterizza la complessità della query per l'ottimizzazione di una funzione: cis.upenn.edu/~mkearns/papers/haystack.pdf , Questo è diverso da quello che desideri, ma potresti apprezzare il lavoro correlato che discute di ciò che è noto sulla caratterizzazione la complessità della query dell'apprendimento esatto.
Aaron Roth

Risposte:


6

Per portare a casa il punto dell'esempio di un alce anonimo, considera la classe concettuale che consiste in funzioni che generano 1 su un solo punto in {0,1} ^ n. La classe ha dimensioni 2 ^ n e nel caso peggiore sono necessarie 2 ^ n query. Dai un'occhiata alla dimensione dell'insegnamento nel caso peggiore (Goldman e Schapire) che fornisce qualcosa di simile a quello che stai cercando.


1
Grazie! La ricerca della dimensione didattica mi ha portato alla dimensione didattica estesa, che è simile al parametro combinatorio che ho menzionato nella domanda, che mi ha portato poi a molti altri articoli interessanti sull'argomento.
Robin Kothari,

4

Non conosco una tale caratterizzazione. Tuttavia, vale la pena notare che per quasi tutte le classi di concetti, è necessario interrogare tutti i punti. Per vedere questo, considera la classe di concetto che consiste di tutti i vettori booleani n-dimensionali con peso di Hamming 1. Questa classe di concetti richiede ovviamente n query per imparare, che è uguale alla sua cardinalità. Probabilmente puoi generalizzare questa osservazione per capire che quasi ogni classe di concetti richiede anche l'esecuzione di tutte le query.

Sospetterei che dato un concetto di classe C come input, è NP-difficile determinare la complessità dell'apprendimento esatto della classe di concetti con le domande di appartenenza, o addirittura approssimarlo fino a dire una costante. Ciò darebbe qualche indicazione che non esiste una "buona" caratterizzazione combinatoria. Se desideri dimostrare un tale risultato di durezza NP, ma prova a fallire, non esitare a pubblicare qui e vedrò se riesco a capirlo (ho alcune idee).


1
Grazie per la risposta. Anche se è vero che quasi tutte le classi di concetti (con una ragionevole distribuzione sulle classi) sono difficili da imparare, alcune classi sono facili da imparare e sarebbe interessante avere un parametro combinatorio che lo caratterizza. Non mi importa se il parametro è difficile da calcolare. Anche la dimensione VC non è nota per essere calcolabile in modo efficiente.
Robin Kothari il

1

Anche se altri hanno indicato la risposta. Ho pensato di poterlo rendere autonomo e mostrare perché dimensione dell'insegnamento è la risposta.

CXSXffCS .

T(f)f(f,C)=min{ |S| | ST(f)}fmin(f)T(f)(C)=fC(f,C)C .

f(f,C)min(f)(C)f


fff

@RobinKothari TD inferiore limita il numero minimo di query in qualsiasi algoritmo MQ. In pratica, potrebbe non esserci alcun algoritmo che raggiunga ciecamente questo limite senza imbrogliare o trucchi del codice. Nel documento "Queries Revisited" di Angluin, ha discusso di un parametro chiamato MQ che rappresenta il numero di query richieste dal miglior algoritmo MQ nel peggiore dei casi. Non ricordo i suoi dettagli ma sicuramente TD <= MQ.
seteropere,

1
Ciò a cui ero interessato (quando ho posto questa domanda) era un parametro che caratterizza l'apprendimento esatto con le domande di appartenenza. Dovrebbe essere sia un limite superiore che inferiore. Ho fornito un esempio di un parametro che raggiunge questo (fino a un log | C | factor) nella domanda. La mia domanda era se si sapesse qualcosa di meglio.
Robin Kothari,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.