Calcolo efficiente o approssimazione della dimensione VC di una rete neurale


19

Il mio obiettivo è risolvere il seguente problema, che ho descritto dal suo input e output:

Ingresso:

Un grafico aciclico diretto con nodi , fonti e sink ( ).solmn1m>n1

Produzione:

Il VC-dimensione (o una sua approssimazione) per la rete neurale con topologia .sol

Più specifici :

  • Ogni nodo in è un neurone sigmoideo. La topologia è fissa, ma i pesi sui bordi possono essere variati dall'algoritmo di apprendimento.sol
  • L'algoritmo di apprendimento è fisso (ad esempio propagazione all'indietro).
  • I nodi sorgente sono i neuroni di input e possono prendere solo stringhe da come input.n{-1,1}n
  • Il nodo sink è l'unità di output. Emette un valore reale da che arrotondiamo per eccesso a o per a se è più di una certa soglia fissa partire da .[-1,1]1-1δ0

L'approccio ingenuo è semplicemente quello di provare a rompere sempre più punti, tentando di addestrare la rete su di essi. Tuttavia, questo tipo di approccio di simulazione non è efficiente.


Domanda

Esiste un modo efficiente (cioè in quando modificato al problema decisionale: la dimensione VC è inferiore al parametro di input ?) Per calcolare questa funzione? In caso contrario, ci sono risultati di durezza?PK

Esiste un modo pratico per calcolare o approssimare questa funzione? Se si tratta di un'approssimazione, ci sono garanzie sulla sua precisione?

Appunti

Ho fatto una domanda simile su stats.SE ma non ha generato alcun interesse.


1
Potrebbe rendere la domanda più autonoma se si potesse rendere più esplicita la funzione di trasferimento. Vale a dire le formule effettive su come si propagano le informazioni.
Suresh,

Risposte:


9

Se sei disposto a limitare ulteriormente il problema lasciando che la rete sia stratificata, allora "Machine Learning" di Tom Mitchell fornisce un limite superiore di ( ) (sezione 7.4.4) dove è il numero di nodi interni (che deve essere maggiore di 2), è la dimensione VC dei singoli nodi ed è la base del logaritmo naturale. Se stai cercando un limite al numero di esempi di allenamento, queste informazioni dovrebbero essere sufficienti.2dSlog(eS)Sde

Non è strettamente una risposta alla tua domanda, ma potrebbe esserti di aiuto lungo la strada. Il risultato è dovuto a Baum e Haussler (1989).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.