D{0,1}d×{0,1}Cf:{0,1}d→{0,1}f∈CO P T ( C , D ) = min f ∈ C e r r ( f , D )
err(f,D)=Pr(x,y)∼D[f(x)≠y]
OPT(C,D)=minf∈C err(f,D)
Supponiamo che un algoritmo
A apprenda agnosticamente
C su qualsiasi distribuzione, se per qualsiasi
D può con probabilità
2/3 trovare una funzione
f tale che
err(f,D)≤OPT(C,D)+ϵ , dato il tempo e un numero di campioni da
D che è delimitato da un polinomio in
d e
1/ϵ .
Domanda: Quali classi di funzioni C sono note per essere agnosticamente apprendibili su distribuzioni arbitrarie?
Nessuna lezione è troppo semplice! So che anche le congiunzioni monotone non sono note per essere agnosticamente apprendibili su distribuzioni arbitrarie, quindi sto solo cercando classi di funzioni non banali.