Definizione del modello di apprendimento PAC


8

Il modello di apprendimento probabilmente approssimativamente corretto (PAC) è definito come:

Una classe di concetti C si dice che sia apprendibile dal PAC se esiste un algoritmo UN e una funzione polinomiale poly(·,·,·,·)tale che per qualsiasi e , per tutte le distribuzioni su e per qualsiasi concetto target , vale per ogni dimensione del campione :ε>0δ>0DXcCmpoly(1/ε,1/δ,n,Sioze(c))

Pr[R(hS)ε]1-δ

dove è l'errore di generalizzazione su un campione di dimensione contenente istanze della variabile seguito alla distribuzione e è il costo massimo della rappresentazione computazionale di .R(hS)SmXDsize(c)cC

So che è un polinomio. Ma qual è la forma esplicita di ? Quali sono le variabili? Qual è il suo grado?poly(1/ε,1/δ,n,size(c))poly(1/ε,1/δ,n,size(c))

Risposte:


6

Non ci sono vincoli su oltre che essere un polinomio, o più in generale, una funzione limitata polinomialmente (cioè una funzione limitata da un polinomio); la differenza non ha importanza in questo caso. Senza perdita di generalità, si può assumere che per qualche , .poly(,,,)A,B>0poly(x,y,z,w)=A(xyzw)B

La definizione sta cercando di modellare la situazione in cui è necessario solo un piccolo numero di campioni per apprendere il concetto. Per quantificare "piccolo", dobbiamo prima decidere in merito a quali quantità sarà piccola (in questo caso, ), e in secondo luogo, quanto è piccola " piccolo". In questo caso, definiamo "piccolo" qualsiasi funzione che cresce al massimo polinomialmente in . In altri casi abbiamo requisiti più severi, diciamo che vogliamo che "piccolo" sia polinomiale in .ϵ,δ,n,size(c)1/ϵ,1/δ,n,size(c)log1ϵ,log1δ,n,size(c)

Una definizione standard nella teoria della complessità è quella del tempo polinomiale. Diciamo che un algoritmo per risolvere alcuni problemi è efficace se su un input di dimensione viene eseguito nel tempo polinomiale in , cioè il suo tempo di esecuzione è limitato da un polinomio in . Nella tua terminologia, potremmo dichiararlo come per alcuni polinomi . Come prima, se per alcuni polinomiali , in realtà per alcuni , e quindi senza perdita di generalità noi può presumere chennT(n)nT(n)poly(n)nT(n)poly(n)poly()T(n)AnBA,B>0poly(n)=AnB. Ma noi non vogliamo decidere in anticipo sui valori di . Siamo felici fintanto che alcuni valori di funzionano.A,BA,B

Il tuo caso è simile, solo il polinomio può dipendere da più quantità anziché da una sola.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.