LOESS che consente discontinuità


14
  • Esiste una tecnica di modellazione come LOESS che consente zero, una o più discontinuità, in cui i tempi delle discontinuità non sono noti apriori?
  • Se esiste una tecnica, esiste un'implementazione esistente in R?

1
discontinuità a valori x noti o a valori x sconosciuti? (noto x è abbastanza facile)
Glen_b -Reinstate Monica

@glen Ho aggiornato la domanda: sono interessato a situazioni in cui i tempi delle discontinuità non sono noti apriori.
Jeromy Anglim,

Questa potrebbe essere una domanda controversa / sciocca, ma dici "tempismo": è per l'uso con le serie temporali? Credo che la maggior parte delle risposte che seguono assumano questo ("punto di cambio, ecc."), Sebbene LOESS possa essere applicato in situazioni di serie non temporali, con discontinuità. Penso.
Wayne,

Risposte:


15

Sembra che tu voglia eseguire il rilevamento di più punti di cambio seguito da un livellamento indipendente all'interno di ciascun segmento. (Il rilevamento può essere online o meno, ma è probabile che l'applicazione non sia online.) C'è molta letteratura su questo; Le ricerche su Internet sono fruttuose.

  • DA Stephens ha scritto un'utile introduzione al rilevamento del punto di cambio bayesiano nel 1994 (App. Stat. 43 # 1 pp 159-178: JSTOR ).
  • Più di recente Paul Fearnhead ha svolto un buon lavoro (ad es. Inferenza bayesiana esatta ed efficiente per molteplici problemi di cambio , Stat Comput (2006) 16: 203-213: PDF gratuito ).
  • Esiste un algoritmo ricorsivo, basato su una bellissima analisi di D Barry e JA Hartigan
    • Modelli di partizione del prodotto per modelli con punto di cambio, ann. Statistica. 20: 260-279: JSTOR ;
    • Un'analisi bayesiana per problemi relativi ai punti di cambiamento, JASA 88: 309-319: JSTOR .
  • Un'implementazione dell'algoritmo di Barry & Hartigan è documentata in O. Seidou e TBMJ Ourda, rilevamento multiplo del cambiamento basato sulla ricorsione nella regressione lineare multivariata e applicazione ai flussi di fiume, Ris. Acqua. Res., 2006: PDF gratuito .

Non ho cercato duramente le implementazioni R (ne avevo codificato una in Mathematica qualche tempo fa) ma apprezzerei un riferimento se ne trovassi una.


3
Ho trovato il pacchetto bcp R jstatsoft.org/v23/i03/paper che implementa l'algoritmo Barry & Hartigan
Jeromy Anglim

@Jeromy: Grazie per il pacchetto R e per aver inserito i collegamenti ai riferimenti.
whuber

7

fallo con la regressione della linea spezzata di Koencker, vedi pagina 18 di questa vignetta

http://cran.r-project.org/web/packages/quantreg/vignettes/rq.pdf

In risposta all'ultimo commento di Whuber:

Questo stimatore è definito in questo modo.

, x ( i )x ( i - 1 )XR ,X(io)X(io-1)io

,eio: =yio-βioX(io)-β0

, z - = max ( - z , 0 ) ,z+=max(z,0)z-=max(-z,0)

, λ 0τ(0,1)λ0

min.βRn|τ,λΣio=1nτeio++Σio=1n(1-τ)eio-+λΣio=2n|βio-βio-1|

fornisce il quantile desiderato (cioè nell'esempio τ = 0.9 ). λ dirige il numero di breakpoint: per λ grande questo stimatore si riduce a nessun break point (corrispondente allo stimatore di regressione quantile lineare classicla).ττ=0.9λλ

Spline di livellamento quantico Roger Koenker, Pin Ng, Stephen Portnoy Biometrika, Vol. 81, n. 4 (dicembre 1994), pagg. 673-680

PS: esiste un documento di lavoro con accesso aperto con lo stesso nome degli stessi altri ma non è la stessa cosa.


È un'idea chiara: grazie per il riferimento. Tuttavia, i residui di quel particolare adattamento sembrano piuttosto cattivi, il che mi fa chiedere quanto bene identifica i potenziali punti di cambiamento.
whuber

whuber: non so quanto tu abbia familiarità con la teoria della regressione quantile. Queste linee hanno un grande vantaggio rispetto alle spline: non assumono alcuna distribuzione degli errori (cioè non assumono che i residui siano gaussiani).
user603

@kwak Sembra interessante. Non dare per scontato una normale distribuzione degli errori sarebbe utile per una delle mie applicazioni.
Jeromy Anglim,

In effetti, ciò che si ottiene da questa stima sono i quantili condizionali reali: in poche parole, si tratta di spline / regressioni LOESS quali sono i grafici a scatola per la coppia (media, sd): una visione molto più ricca dei tuoi dati. Mantengono anche la loro validità in un contesto non gaussiano (come errori assimetrici, ...).
user603

@kwak: i residui sono fortemente correlati con la coordinata x. Ad esempio, ci sono lunghe serie di residui positivi negativi o piccoli. Che abbiano una distribuzione gaussiana o no, quindi, è irrilevante (oltre che irrilevante in qualsiasi analisi esplorativa): questa correlazione mostra che l'adattamento è scarso.
whuber

6

Ecco alcuni metodi e pacchetti R associati per risolvere questo problema

Wavelet stima thresolding nella regressione consente discontonuities. È possibile utilizzare il pacchetto wavethresh in R.

Molti metodi basati sugli alberi (non lontani dall'idea di wavelet) sono utili quando si hanno disconnessioni. Quindi pacchetto treethresh, pacchetto albero!

Nella famiglia dei metodi della " massima verosimiglianza locale " ... tra gli altri: Lavoro di Pozhel e Spokoiny: pesi adattativi Smoothing (pacchetto aws) Lavoro di Catherine Loader: pacchetto locfit

Immagino che qualsiasi kernel più fluido con larghezza di banda variabile localmente sia il punto, ma non conosco il pacchetto R per questo.

nota: non capisco davvero qual è la differenza tra LOESS e la regressione ... è l'idea che in LOESS gli algoritmi dovrebbero essere "on line"?


1
Ri LOESS: Forse la mia terminologia non è del tutto corretta. Con LOESS mi riferisco ai modelli che prevedono Y da X usando una qualche forma di adattamento della curva localizzata. ad esempio, come si vede nella maggior parte di questi grafici: google.com/…
Jeromy Anglim

2

Dovrebbe essere possibile codificare una soluzione in R usando la funzione di regressione non lineare nls, b splines (la funzione bs nel pacchetto spline, ad esempio) e la funzione ifelse.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.