Ipotesi di modello della regressione parziale dei minimi quadrati (PLS)


13

Sto cercando di trovare informazioni relative alle ipotesi di regressione di PLS (singola ). Sono particolarmente interessato a un confronto tra le ipotesi di PLS rispetto a quelle della regressione OLS. y

Ho letto / sfogliato una grande quantità di letteratura sull'argomento PLS; articoli di Wold (Svante ed Herman), Abdi e molti altri, ma non hanno trovato una fonte soddisfacente.

Wold et al. (2001) regressione PLS: uno strumento di base della chemiometria menziona le ipotesi di PLS, ma menziona solo che

  1. Le X non devono essere indipendenti,
  2. il sistema è una funzione di alcune variabili latenti sottostanti,
  3. il sistema dovrebbe mostrare omogeneità durante tutto il processo analitico e
  4. l'errore di misura in è accettabile. X

Non viene menzionato alcun requisito dei dati osservati, o residui del modello. Qualcuno sa di una fonte che affronta qualcosa di tutto ciò? Considerare che la matematica di base è analoga a PCA (con l'obiettivo di massimizzare la covarianza tra e X ) è una normalità multivariata di ( y , X ) un'ipotesi? I residui di modello devono presentare omogeneità di varianza?yX(y,X)

Credo anche di aver letto da qualche parte che le osservazioni non devono essere indipendenti; cosa significa questo in termini di studi su misure ripetute?


Il link a Wold. et al non è corretto. È quello che dovrebbe essere? libpls.net/publication/PLS_basic_2001.pdf
emudrak

Un cliente ha fatto un commento del revisore a un documento che diceva qualcosa "mostra che hai verificato l'assunto di linearità". come lo faresti?
emudrak,

Risposte:


5

yX

Più in generale, i "presupposti" sono qualcosa che solo un risultato teorico (teorema) può avere.

yX

Inoltre, il risultato effettivo della regressione PLS dipende dal numero di componenti PLS inclusi nel modello, che funge da parametro di regolarizzazione. Parlare di qualsiasi ipotesi ha senso solo se la procedura per selezionare questo parametro è completamente specificata (e di solito non lo è). Quindi non penso che ci siano risultati di ottimalità per PLS, il che significa che la regressione di PLS non ha ipotesi. Penso che lo stesso sia vero per qualsiasi altro metodo di regressione penalizzato come la regressione della componente principale o la regressione della cresta.

Aggiornamento: ho ampliato questo argomento nella mia risposta a Quali sono i presupposti della regressione della cresta e come testarli?

Naturalmente, ci possono essere ancora delle regole empiriche che dicono quando è probabile che la regressione del PLS sia utile e quando no. Si prega di vedere la mia risposta collegata sopra per qualche discussione; I praticanti esperti di PLSR (non sono uno di loro) potrebbero certamente dire di più.


Che dire della normalità e dell'indipendenza del campionamento?
WCMC

3

Apparentemente, PLS non fa ipotesi "difficili" sulla distribuzione congiunta delle variabili. Ciò significa che devi fare attenzione a scegliere le statistiche di test appropriate (suppongo che questa mancanza di dipendenza dalle distribuzioni variabili classifichi il PLS come una tecnica non parametrica). I suggerimenti che ho trovato per le statistiche appropriate sono 1) utilizzando r-quadrato per variabili latenti dipendenti e 2) metodi di ricampionamento per valutare la stabilità delle stime.

La principale differenza tra OLS / MLS e PLS è che la prima utilizza in genere la stima della massima verosimiglianza dei parametri della popolazione per prevedere le relazioni tra le variabili, mentre PLS stima i valori delle variabili per la popolazione reale per predire le relazioni tra gruppi di variabili (associando gruppi di predittore / variabili di risposta con variabili latenti).

Sono anche interessato a gestire esperimenti replicati / ripetuti, in particolare quelli multifattoriali, tuttavia non sono sicuro di come affrontare questo utilizzando PLS.

Manuale dei minimi quadrati parziali: concetti, metodi e applicazioni (pagina 659, sezione 28.4)

Wold, H. 2006. Specifiche predittore. Enciclopedia delle scienze statistiche. 9.

http://www.rug.nl/staff/tkdijkstra/latentvariablesandindices.pdf (pagine 4 e 5)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.