Che cosa significa "invarianza di permutazione" nel contesto delle reti neurali che riconoscono l'immagine?


Risposte:


17

In questo contesto, ciò si riferisce al fatto che il modello non assume alcuna relazione spaziale tra le caratteristiche. Ad esempio per perceptron multistrato, è possibile permutare i pixel e le prestazioni sarebbero le stesse. Questo non è il caso delle reti convoluzionali, che assumono relazioni di vicinato.


1
sì, questa è la parte confusa. Non dovrebbe esserci una relazione spaziale nella classificazione delle cifre?
RockTheStar,

1
MNIST è ampiamente usato come punto di riferimento (o controllo di integrità) nelle reti neurali. Se il tuo modello può ottenere un errore <1% su MNIST invariante di permutazione, sei pronto per qualcosa.
Bayerj,

1
Sì, voglio dire, non esiste una relazione spaziale anche nelle cifre? Se permetti i pixel delle cifre, cambierà l'ordine dei pixel, il che influisce essenzialmente sulle prestazioni !?
RockTheStar,

1
Solo se il modello lo presuppone. mlps no, convnets sì. Ecco perché confrontare un convnet con un mlp su mnist è alquanto ingiusto.
Bayerj,

1
Vedo! Quindi, nel set di dati di mnist, mlps ha prestazioni migliori o convnet?
RockTheStar,

6

fx=(x1,,xn)fxn=3

f((X1,X2,X3))=f((X2,X1,X3))=f((X3,X1,X2))

1
Questa risposta è un po 'fuorviante, perché l'apprendimento automatico dell'algoritmo di apprendimento è spesso invariante di permutazione, mentre la funzione che restituisce non lo è.
Bayerj,

@bayerj: Questa è un'informazione interessante, ma non riesco a vedere che rende la definizione che ho dato fuorviante , è una definizione corretta, ma forse non è una risposta completa in questo contesto.
kjetil b halvorsen,

Hai ragione, la definizione è corretta. Ma non è applicabile nel modo in cui lo scrivi. Nel contesto del MNIST invariante di permutazione, di cui l'OP stava chiedendo, non si verificano le funzioni del modulo che scrivi.
Bayerj,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.