Rapporti di regressione, alias Domande su Kronmal


14

Di recente, alcune domande a scelta casuale hanno innescato un ricordo di un commento fuori mano di uno dei miei professori qualche anno fa che mi avvisava dell'uso dei rapporti nei modelli di regressione. Così ho iniziato a leggere su questo, portando alla fine a Kronmal 1993.

Voglio assicurarmi di interpretare correttamente i suoi suggerimenti su come modellarli.


  1. Z-1Y=Z-11nβ0+Z-1XβX+βZ+Z-1ε

    • Registra il rapporto dipendente dalla variabile (inversa) del denominatore in aggiunta agli altri rapporti
    • Peso per la variabile (inversa) del denominatore

  2. Y=β0+βXX+Z1nα0+ZXαX+Z-1ε

    • Registra il numeratore per variabili originali, denominatore e denominatore per le variabili originali [che dire delle variabili categoriche?]
    • Peso per denominatore (inverso)
  3. Y=β0+XβX+Z-11nβZ-1+WβW+Z-1WβZ-1W+ε

    • Includi numeratore e denominatore (inverso) come effetti principali, rapporto come termine di interazione.

Le mie interpretazioni qui sono corrette?

Risposte:


1

Avresti dovuto davvero collegarti al documento Kronmal (e spiegare la tua notazione, che è presa direttamente dalla carta). La tua lettura della carta è troppo letterale. In particolare, non fornisce consigli sulla ponderazione, piuttosto dicendo che la ponderazione può essere eseguita nei modi consueti, quindi non è necessario discutere. Viene menzionato solo come una possibilità. Leggi i tuoi casi più come esempi, in particolare come esempi su come analizzare tali situazioni.

Nella sezione 6 fornisce alcuni consigli generali, che citerò qui:

Il messaggio di questo articolo è che le variabili di rapporto dovrebbero essere utilizzate solo nel contesto di un modello lineare completo in cui sono incluse le variabili che compongono il rapporto e è presente anche il termine di intercettazione. La pratica comune di utilizzare i rapporti per la variabile dipendente o indipendente nell'analisi di regressione può portare a inferenze fuorvianti e raramente si traduce in alcun guadagno. Questa pratica è diffusa e radicata, tuttavia, e può essere difficile convincere alcuni ricercatori a rinunciare al rapporto o all'indice più preziosi.

L'articolo utilizza l'esempio (fittizio) di Neyman su nascite e cicogne. Per giocare con quell'esempio, puoi accedervi da R di

data(stork, package="TeachingDemos")

Lascerò il divertimento per i lettori, ma una trama interessante è questa coplot:

trama di condizionamento per l'esempio delle cicogne di Neyman

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.