Il modello sottostante di PLS è che una data matrice e vettore sono correlate da dove è una matrice latente ed sono termini di rumore (supponendo che siano centrati).X n y X = T P ′ + E , y = T q ′ + f , T n × k E , f X , y
PLS produce stime di e un vettore 'scorciatoia' dei coefficienti di regressione, tale che . Vorrei trovare la distribuzione di in alcune ipotesi di semplificazione, che dovrebbero probabilmente includere quanto segue:β y ~ X β β
- Il modello è corretto, ovvero per sconosciuto ;T , P , q
- Il numero di fattori latenti, , è noto e utilizzato nell'algoritmo PLS;
- I termini di errore effettivi sono normali a media zero con varianze note;
Questa domanda è in qualche modo indefinita perché ci sono decine di varianti dell'algoritmo PLS "," ma accetterei risultati per ognuna di esse. Accetterei anche una guida su come stimare la distribuzione di tramite ad esempio un bootstrap, ma forse questa è una domanda separata.