Funzioni di influenza e OLS


15

Sto cercando di capire come funzionano le funzioni di influenza. Qualcuno potrebbe spiegare nel contesto di una semplice regressione OLS

yi=α+βxi+εi

dove voglio la funzione influenza per .β


2
Non c'è ancora una domanda specifica qui: vuoi vedere come viene calcolata la funzione di influenza? Vuoi un esempio empirico specifico? Una spiegazione euristica di cosa significhi?
whuber

1
Se cerchi l'articolo di Frank Critchley del 1986 "influenza le funzioni nei componenti principali" (non ricordi il nome esatto del documento). Definisce qui la funzione di influenza per la regressione ordinaria (che può o meno dimostrare la mia risposta sbagliata).
Probislogic

Risposte:


15

Le funzioni di influenza sono sostanzialmente uno strumento analitico che può essere utilizzato per valutare l'effetto (o "influenza") della rimozione di un'osservazione sul valore di una statistica senza dover ricalcolare quella statistica . Possono anche essere utilizzati per creare stime di varianza asintotica. Se l'influenza è uguale a allora la varianza asintotica è .I 2II2n

Il modo in cui comprendo le funzioni di influenza è il seguente. Hai una sorta di CDF teorico, indicato da . Per un semplice OLS, haiFi(y)=Pr(Yi<yi)

Φ(z)σ2S(F)FFF(i)(z)=(1+ζ)F(z)-ζδ(i)(z)δi(z)=I(yi<z)ζ=1

Pr(Yi<yi)=Pr(α+βxi+ϵi<yi)=Φ(yi(α+βxi)σ)
Dove è il normale CDF standard e è la varianza dell'errore. Ora puoi mostrare che qualsiasi statistica sarà una funzione di questo CDF, quindi la notazione (cioè una funzione di ). Supponiamo ora di cambiare la funzione di "un po '", in Where e . Pertanto rappresenta il CDF dei dati con il punto dati "ith" rimosso. Possiamo fare una serie di TaylorΦ(z)σ2S(F)FFF(i)(z)=(1+ζ)F(z)ζδ(i)(z)δi(z)=I(yi<z) F(i)F(i)(z)ζ=0ζ=1n1F(i)F(i)(z) circa . Questo da:ζ=0

S[F(i)(z,ζ)]S[F(i)(z,0)]+ζ[S[F(i)(z,ζ)]ζ|ζ=0]

Nota che quindi otteniamo: S [ F ( i ) ( z , ζ ) ] S [ F ( z ) ] + ζ [ S [ F ( i ) ( z , ζ ) ]F(i)(z,0)=F(z)

S[F(i)(z,ζ)]S[F(z)]+ζ[S[F(i)(z,ζ)]ζ|ζ=0]

La derivata parziale qui è chiamata la funzione di influenza. Quindi questo rappresenta una correzione approssimativa del "primo ordine" da apportare a una statistica a causa dell'eliminazione dell'osservazione "I". Si noti che nella regressione il resto non va a zero asintoticamente, quindi questa è un'approssimazione delle modifiche che si possono effettivamente ottenere. Ora scrivi come:β

β=1nj=1n(yjy¯)(xjx¯)1nj=1n(xjx¯)2

Quindi beta è una funzione di due statistiche: la varianza di X e la covarianza tra X e Y. Queste due statistiche hanno rappresentazioni in termini di CDF come:

v a r ( X ) = ( X - μ x ( F ) ) 2 d F μ x = x d F

cov(X,Y)=(Xμx(F))(Yμy(F))dF
e dove
var(X)=(Xμx(F))2dF
μx=xdF

Per rimuovere la sua osservazione sostituiamo in entrambi gli integrali per dare:FF(i)=(1+ζ)Fζδ(i)

μx(i)=xd[(1+ζ)Fζδ(i)]=μxζ(xiμx)
Var(X)(i)=(Xμx(i))2dF(i)=(Xμx+ζ(xiμx))2d[(1+ζ)Fζδ(i)]

ignorando i termini di e semplificando otteniamo: Allo stesso modo per la covarianza ζ2

Var(X)(i)Var(X)ζ[(xiμx)2Var(X)]
Cov(X,Y)(i)Cov(X,Y)ζ[(xiμx)(yiμy)Cov(X,Y)]

Quindi ora possiamo esprimere in funzione di . Questo è:β(i)ζ

β(i)(ζ)Cov(X,Y)ζ[(xiμx)(yiμy)Cov(X,Y)]Var(X)ζ[(xiμx)2Var(X)]

Ora possiamo usare la serie Taylor:

β(i)(ζ)β(i)(0)+ζ[β(i)(ζ)ζ]ζ=0

Semplificando ciò si ottiene:

β(io)(ζ)β-ζ[(Xio-μX)(yio-μy)Vun'r(X)-β(Xio-μX)2Vun'r(X)]

E inserendo i valori delle statistiche , , e otteniamo:μyμXvun'r(X)ζ=1n-1

β(io)β-Xio-X¯n-1[yio-y¯1nΣj=1n(Xj-X¯)2-βXio-X¯1nΣj=1n(Xj-X¯)2]

E puoi vedere come è possibile approssimare l'effetto della rimozione di una singola osservazione senza dover adattare nuovamente il modello. Puoi anche vedere come una x uguale alla media non ha influenza sulla pendenza della linea . Pensaci e vedrai come ha senso. Puoi anche scrivere questo in modo più succinto in termini di valori standardizzati (in modo simile per y):X~=X-X¯SX

β(io)β-Xio~n-1[yio~SySX-Xio~β]

Quindi la storia riguarda l'influenza di un punto dati aggiuntivo? Mi sono più abituato alla risposta all'impulso per i dati delle serie temporali, in un contesto statistico tutta l'influenza sarebbe descritta da un effetto marginale o (migliore scelta) coefficiente beta dalla regressione standardizzata. Beh, ho davvero bisogno di più contesto per giudicare la domanda e la risposta, ma questo è carino, penso (+1 non ancora ma in attesa).
Dmitrij Celov,

@dmitrij - Questo è ciò che era implicito (o che ho dedotto) dal link - riguarda le proprietà di robustezza di una statistica. Le funzioni di influenza sono leggermente più generali di 1 punto dati: puoi ridefinire la funzione delta per essere una somma di esse (tante osservazioni). Lo considererei un "coltello a buon mercato" in una certa misura, perché non è necessario un nuovo montaggio del modello.
Probislogic

10

Ecco un modo super generale per parlare delle funzioni di influenza di una regressione. Per prima cosa affronterò un modo di presentare le funzioni di influenza:

Supponiamo che sia una distribuzione su . La funzione di distribuzione contaminata , può essere definita come: dove è la misura di probabilità su che assegna la probabilità da 1 a e 0 a tutti gli altri elementi di .FΣFε(X)

Fε(X)=(1-ε)F+εδX
δXΣ{X}Σ

Da questo possiamo definire abbastanza facilmente la funzione di influenza:

La funzione di influenza di in , è definita come: θ^Fψio:XΓ

ψθ^,F(X)=limε0θ^(Fε(X))-θ^(F)ε

Da qui è possibile vedere che una funzione di influenza è la derivata di Gateaux di in nella direzione di . Questo rende l'interpretazione delle funzioni di influenza (per me) un po 'più chiara: una funzione di influenza ti dice l'effetto che una particolare osservazione ha sullo stimatore.θ^FδX

La stima OLS è una soluzione al problema:

θ^=argminθE[(Y-Xθ)T(Y-Xθ)]

Immagina una distribuzione contaminata che metta un po 'più di peso sull'osservazione :(X,y)

θ^ε=argminθ(1-ε)E[(Y-Xθ)T(Y-Xθ)]+ε(y-Xθ)T(y-Xθ)

Condizioni del primo ordine:

{(1-ε)E[XTX]+εXTX}θ^ε=(1-ε)E[XTY]+εXTy

Poiché la funzione di influenza è solo un derivato di Gateaux ora possiamo dire:

-(E[XTX]+XTX)θ^ε+E[XTX]ψθ(X,y)=-E[XTY]+XTy

At , , quindi:ε=0θ^ε=θ^=E[XTX]-1E[XTY]

ψθ(X,y)=E[XTX]-1XT(y-Xθ)

La controparte del campione finito di questa funzione di influenza è:

ψθ(X,y)=(1NΣioXioTXio)-1XT(y-Xθ)

In generale, trovo che questo framework (lavorare con le funzioni di influenza come derivati ​​di Gateaux) sia più facile da gestire.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.