Come calcolare gli intervalli di confidenza sui coefficienti di regressione in PLS?


10

Il modello sottostante di PLS è che una data matrice e vettore sono correlate da dove è una matrice latente ed sono termini di rumore (supponendo che siano centrati).X n y X = T P + E , y = T q + f , T n × k E , f X , yn×mXny

X=TP+E,
y=Tq+f,
Tn×kE,fX,y

PLS produce stime di e un vettore 'scorciatoia' dei coefficienti di regressione, tale che . Vorrei trovare la distribuzione di in alcune ipotesi di semplificazione, che dovrebbero probabilmente includere quanto segue:β y ~ X β βT,P,qβ^yXβ^β^

  1. Il modello è corretto, ovvero per sconosciuto ;T , P , qX=TP+E,y=Tq+fT,P,q
  2. Il numero di fattori latenti, , è noto e utilizzato nell'algoritmo PLS;k
  3. I termini di errore effettivi sono normali a media zero con varianze note;

Questa domanda è in qualche modo indefinita perché ci sono decine di varianti dell'algoritmo PLS "," ma accetterei risultati per ognuna di esse. Accetterei anche una guida su come stimare la distribuzione di tramite ad esempio un bootstrap, ma forse questa è una domanda separata.β^

Risposte:


9

Conoscete questo articolo: regressione PLS: uno strumento base di chemiometria ? La derivazione di SE e CI per i parametri PLS è descritta nel §3.11.

In genere mi affido a Bootstrap per il calcolo di elementi della configurazione, come suggerito ad esempio in Abdi, H. regressione dei minimi quadrati parziali e proiezione sulla regressione della struttura latente (regressione PLS) . Mi sembra di ricordare che ci sono soluzioni teoriche discusse in Tenenhaus M. (1998) La regressione PLS: Théorie et pratique (Technip), ma per ora non posso controllare perché non ho il libro. Per ora, ci sono alcuni pacchetti R utili, come plsRglm .

PS Ho appena scoperto l'articolo di Nicole Krämer , in riferimento al pacchetto plsdof R.


2

Ho scoperto un articolo di Reiss, et. al. , Calcolo dell'intervallo di confidenza dei minimi quadrati parziali per la previsione della qualità di fine lotto industriale , in cui appare la citazione:

La previsione PLS deve essere accompagnata da un intervallo di confidenza online per indicare l'accuratezza della previsione. La formulazione dell'intervallo di confidenza per la previsione di PLS è un'area di studio che non ha concluso un "gold standard".

Questo documento contiene un riferimento all '"eccellente sondaggio di tale lavoro", errore di predizione standard per PLS multiway , di Faber e Bro, e un articolo di Faber e Kowalski, Propagazione di errori di misurazione per la convalida delle previsioni ottenute dalla regressione del componente principale e minimi quadrati parziali . Riassumo questi risultati non appena saranno disponibili ...


(+1) Buono a sapersi, grazie. Dovrei rivedere il lavoro di Michel Tenenhaus - ti farò sapere se trovo che sth sia interessante.
chl
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.