Spiegare la regressione quantile ai non statisti


14

Di recente ho presentato un articolo in cui ho usato la regressione quantile a un giornale di psicologia. Sebbene pensassi di aver già pensato abbastanza in una chiara esposizione della regressione quantile, i revisori hanno chiesto spiegazioni migliori sulla tecnica di regressione quantile conoscendo solo la regressione OLS standard.

Quindi, qual è il modo migliore per spiegare la regressione quantile, in un documento empirico, ai non statistici?


1
Penso che tu debba spiegare perché hai scelto la regressione quantile piuttosto che la regressione dei minimi quadrati. I residui non venivano normalmente distribuiti usando la regressione dei minimi quadrati?
Glen,

1
Abbiamo scelto la regressione quantile per ragioni teoriche. In particolare, eravamo interessati all'intera distribuzione della variabile dipendente.
Johannes,

2
@Johannes, potresti trovare questo utile e la letteratura che cita. Inoltre, Glen, i residui non normali non sono motivo per escludere l'uso di OLS; vedi qui , per esempio.
ospite

1
direi che se i residui si discostano significativamente dai minimi quadrati normali potrebbe non essere un buon metodo di stima a causa della sua sensibilità ai valori anomali. Quindi è necessaria una valida alternativa all'OLS.
Michael R. Chernick,

1
Questa è un'introduzione eccellente pubblicata nel 2014 "La regressione quantistica nello studio delle scienze dello sviluppo" Child Dev 85: 861-881.
N Brouwer,

Risposte:


12

Vorrei sottolineare la motivazione e non i tecnicismi (basta dare un riferimento). In particolare:

  • Distribuzione libera: non si desidera assumere la forma parametrica della distribuzione degli errori.
  • Robustezza: sospetti che la tua variabile dipendente possa essere contaminata.

Il recupero dell'intera distribuzione (condizionale) da sola non giustifica la regressione quantile, dal momento che, secondo il presupposto della Normalità, la media e la varianza sono sufficienti per recuperare l'intera distribuzione. E lo stesso vale per qualsiasi altra distribuzione di errori parametrici.


Non capisco che "la media e la varianza sono sufficienti per recuperare l'intera distribuzione". Supponiamo che la mia variabile dipendente sia l'IMC e che io sia interessato a fare deduzione sugli individui in coda alla sua distribuzione, come posso usare esattamente i normali metodi di regressione?
Davide

5

Prova a sviluppare l'intuitività attraverso la comprensione da parte del recensore / pubblico delle statistiche più semplici.

Perché dovresti usare la mediana invece della media come misura della tendenza centrale? Se riesci a trasmettere questo punto, il resto dovrebbe seguire.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.