Questa figura particolare in Hastie et al. è stato prodotto senza calcolare le equazioni dei limiti di classe. Invece, è stato utilizzato l'algoritmo delineato da @ttnphns nei commenti, vedere la nota 2 nella sezione 4.3, pagina 110:
Per questa figura e molte altre figure simili nel libro calcoliamo i confini delle decisioni con un metodo di contornatura completo. Calcoliamo la regola di decisione su un reticolo di punti, quindi utilizziamo algoritmi di contornatura per calcolare i confini.
Tuttavia, procederò con la descrizione di come ottenere equazioni dei limiti della classe LDA.
Cominciamo con un semplice esempio 2D. Ecco i dati dal set di dati di Iris ; Scarto le misure del petalo e considero solo la lunghezza e la larghezza del sepal. Tre classi sono contrassegnate con i colori rosso, verde e blu:
Indichiamo medie di classe (centroidi) come . LDA presume che tutte le classi abbiano la stessa covarianza all'interno della classe; dati i dati, questa matrice di covarianza condivisa è stimata (fino al ridimensionamento) come W = ∑ i ( xμ1,μ2,μ3 , dove la somma è sopra tutti i punti dati e il centroide del rispettivo la classe viene sottratta da ogni punto.W=∑i(xi−μk)(xi−μk)⊤
Per ogni coppia di classi (ad esempio classe e 2 ) c'è un limite di classe tra di loro. È ovvio che il confine deve passare attraverso il punto medio tra i due centroidi classe ( μ 1 + μ 2 ) / 212(μ1+μ2)/2 . Uno dei risultati LDA centrali è che questo limite è una linea retta ortogonale a . Esistono diversi modi per ottenere questo risultato, e anche se non faceva parte della domanda, accennerò brevemente a tre di essi nell'Appendice di seguito.W−1(μ1−μ2)
Nota che ciò che è scritto sopra è già una specifica precisa del confine. Se si vuole avere un'equazione linea nel modulo standard , quindi coefficienti un e b possono essere calcolati e sarà dato da alcune formule disordinato. Difficilmente riesco a immaginare una situazione in cui ciò sarebbe necessario.y=ax+bab
Ora applichiamo questa formula all'esempio di Iris. Per ogni coppia di classi trovo un punto medio e traccia una linea perpendicolare a :W−1(μi−μj)
Tre linee si intersecano in un punto, come avrebbe dovuto essere previsto. I limiti di decisione sono dati dai raggi a partire dal punto di intersezione:
Si noti che se il numero di classi è K≫2K(K−1)/2
In dimensioni la formula rimane esattamente la stessa : il confine è ortogonale a W - 1 ( μ 1 - μ 2 ) e passa attraverso ( μ 1D>2W−1(μ1−μ2)(μ1+μ2)/2D−1
Appendice
Come vedere che il confine è una linea retta ortogonale a W−1(μ1−μ2)
Il modo elegante: W−1μ1−μ2
xk(x−μk)⊤W−1(x−μk)12x⊤W−1(μ1−μ2)=const
Wμ1−μ2WW=UDU⊤S=D−1/2U⊤SS(μ1−μ2)S−1S⊤S(μ1−μ2)S