Come capire "non lineare" come in "riduzione della dimensionalità non lineare"?


24

Sto cercando di comprendere le differenze tra i metodi di riduzione della dimensionalità lineare (ad es. PCA) e quelli non lineari (ad es. Isomap).

Non riesco proprio a capire cosa implica la (non) linearità in questo contesto. Ho letto da Wikipedia che

In confronto, se PCA (un algoritmo di riduzione della dimensionalità lineare) viene utilizzato per ridurre lo stesso set di dati in due dimensioni, i valori risultanti non sono così ben organizzati. Ciò dimostra che i vettori ad alta dimensione (ognuno dei quali rappresenta una lettera 'A') che campionano questa varietà variano in modo non lineare.

Cosa fa

i vettori ad alta dimensione (ognuno dei quali rappresenta una lettera 'A') che campionano questa varietà variano in modo non lineare.

significare? O più in generale, come posso capire la (non) linearità in questo contesto?

Risposte:


20

Riduzione della dimensionalità significa che si mappa ogni vettore multidimensionale in un vettore a bassa dimensione. In altre parole, rappresenti (sostituisci) ogni vettore multidimensionale con un vettore a bassa dimensione.

Riduzione della dimensionalità lineare significa che i componenti del vettore a bassa dimensione sono dati dalle funzioni lineari dei componenti del vettore ad alta dimensione corrispondente. Ad esempio in caso di riduzione a due dimensioni abbiamo:

[x1, x2, ..., xn] ->  [f1(x1, x2, ..., xn), f2(x1, x2, ..., xn)]

Se f1e f2sono funzioni (non) lineari, abbiamo una riduzione di dimensionalità (non) lineare.


3
f(un'X+B)=un'f(X)+Bw1X1++wnXn

1
fio=fio(X1,...,Xn)=c(io)+ω1(io)X1+...ωn(io)XnfioXiosono i componenti dei vettori a bassa e alta dimensione, rispettivamente (e penso che non sia quello che intendi). Ho pensato che il problema non fosse nella comprensione di cosa sia una funzione lineare ma in cui appare la linearità.
Roman

49

Un'immagine vale più di mille parole:

PCA vs Isomap

Qui stiamo cercando una struttura monodimensionale in 2D. I punti si trovano lungo una curva a forma di S. PCA cerca di descrivere i dati con una varietà lineare monodimensionale, che è semplicemente una linea; ovviamente una linea si adatta a questi dati piuttosto male. Isomap è alla ricerca di una varietà monodimensionale non lineare (cioè curva!) E dovrebbe essere in grado di scoprire la curva a forma di S sottostante.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.