Nella fattorizzazione NMF, il parametro (annotato r nella maggior parte della letteratura) è il rango dell'approssimazione di V ed è scelto in modo tale che k < min ( m , n ) . La scelta del parametro determina la rappresentazione dei tuoi dati V in una base troppo completa composta dalle colonne di W ; il w i , i = 1 , 2 , ⋯ , k . Il risultato è che i ranghi delle matrici W e H hanno un limite superiore dikrVk<min(m,n)VWwi , i=1,2,⋯,kWH e il prodotto W H è un'approssimazione di basso rango di V ; anche k al massimo. Quindi la scelta di k < min ( m , n ) dovrebbe costituire una riduzione di dimensionalità in cui V può essere generato / esteso dai vettori di base di cui sopra.kWHVkk<min(m,n)V
Ulteriori dettagli possono essere trovati nel capitolo 6 di questo libro di S. Theodoridis e K. Koutroumbas.
Dopo aver minimizzato la funzione di costo prescelta rispetto a e H , la scelta ottimale di k , ( scelta empiricamente lavorando con diversi spazi secondari delle caratteristiche) dovrebbe dare V ∗ , un'approssimazione di V , con caratteristiche rappresentative della matrice iniziale dei dati V . WHkV∗VV
Lavorare con diversi spazi secondari di funzionalità, nel senso che, il numero di colonne in W , è il numero di vettori di base nel sotto-spazio NMF. E lavorare empiricamente con valori diversi di k equivale a lavorare con spazi di caratteristiche con ridotte dimensioni.kWk