L'idea di base della regressione quantile deriva dal fatto che l'analista è interessato alla distribuzione dei dati piuttosto che alla media dei dati. Iniziamo con la media.
La regressione media si adatta a una linea della forma di alla media dei dati. In altre parole, . Un approccio generale per stimare questa linea sta usando il metodo del minimo quadrato, .E ( Y | X = x ) = x β arg min β ( y - x β ) ′ ( y - X β )y=XβE(Y|X=x)=xβargminβ(y−xβ)′(y−Xβ)
D'altra parte, la regressione mediana cerca una linea che prevede che metà dei dati siano sui lati. In questo caso la funzione target èdoveè la prima norma.| . |argminβ|y−Xβ||.|
Estensione dell'idea della mediana ai risultati quantili nella regressione quantile. L'idea alla base è quella di trovare una linea che -percent di dati va oltre.α
Qui hai fatto un piccolo errore, la regressione Q non è come trovare un quantile di dati, quindi adattare una linea a quel sottoinsieme (o anche ai bordi che sono più difficili).
La regressione Q cerca una linea che divide i dati in un qroup a quantile e il resto . Funzione target, dicendo che la funzione di controllo della regressione Q è
β alfa = arg min β { alfa | y - X β | I ( y > X β ) + ( 1 -α
β^α=argminβ{α|y−Xβ|I(y>Xβ)+(1−α)|y−Xβ|I(y<Xβ)}.
Come vedi questa intelligente funzione target non è altro che tradurre il quantile in un problema di ottimizzazione.
Inoltre, come vedi, la regressione Q è definita per un certo quantificare ( ) e quindi può essere estesa per trovare tutti i quantili. In altre parole, la regressione Q può riprodurre la distribuzione (condizionale) della risposta.βα