Regressione logistica: interpretazione delle variabili continue


11

Ho avuto un paio di domande sull'interpretazione dei rapporti di probabilità per variabili continue nella regressione logistica. Sento che queste sono domande di base sulla regressione logistica (e probabilmente sulla regressione in generale), e anche se mi vergogno leggermente di non conoscere le risposte, ingoierò il mio orgoglio e le farò, quindi le conosco in il futuro!

Ecco la mia situazione ... Sto guardando un campione di giovani giudicati che, come parte della loro libertà vigilata, sono stati arruolati in un programma di formazione professionale / professionale. Volevo vedere fino a che punto l'età in cui erano stati rilasciati dal programma prevedeva l'occupazione sei mesi dopo l'uscita dal programma.

(Inoltre, tieni presente che ci sono altri predittori nel modello, ma li ho esclusi perché non sono statisticamente significativi e voglio mantenerlo il più chiaro possibile.)

Predittore: età di rilascio dal programma di allenamento (età media = 17,4, DS = 1,2, intervallo 14,3-20,5)

Risultato: impiegato o no (impiegato = 1, non impiegato = 0)

Risultato: Odds ratio 3.01 (p <.005) (ho escluso la bontà delle statistiche di adattamento, ecc. Perché sto cercando risposte sull'interpretazione del solo odds ratio; mi sento a mio agio con la valutazione dell'adattamento del modello, CI , eccetera.)

In parole povere: con l'aumentare dell'età di un anno, le probabilità di essere assunti sei mesi dopo la dimissione aumentano di tre unità.

Domande:

1) Quando dico "Man mano che l'età aumenta di un anno ..." qual è il punto di partenza per l'età?

L'età inizia da zero? Ad esempio, "Con l'aumentare dell'età da 0 [ovvero l'età più bassa se si dovesse posizionare questo modello su un grafico] ..."

L'età inizia all'età più bassa nell'intervallo di età nel campione? Ad esempio, "Con l'aumentare dell'età da 14.3 ..."

O

L'età inizia all'età media del campione? Ad esempio, "Con l'aumentare dell'età da 17,4 ...",

2) La centratura mi aiuterebbe a interpretare questo risultato O è efficace solo nell'interpretazione di y-int? Se fosse di aiuto, stavo pensando di centrare o sottrarre l'età più bassa dell'intervallo da tutte le altre età del campione. Eventuali suggerimenti?

3) Infine, è appropriato dire che rispetto a un ragazzo di 14 anni, un ragazzo di 17 anni ha nove volte più probabilità di essere impiegato? Lo chiedo perché so che la regressione logistica assume una relazione sigmoidale e sono curioso di sapere se questo aumento di 3 unità nelle probabilità rimanga coerente in qualsiasi punto lungo la linea di regressione.

Grazie mille!

Aaron


1
Potresti essere interessato a questo .
Tchakravarty,

4
La rimozione di variabili "insignificanti" è molto problematica.
Frank Harrell,

@FrankHarrell potresti approfondire il motivo per cui la rimozione di variabili insignificanti è molto problematica in questo caso?
Mark White,

Questo è stato discusso a lungo su questo sito. In breve rovina errori standard, valori P, copertura dell'intervallo di confidenza, ecc.
Frank Harrell,

Risposte:


6

1) Dal momento che è un odds ratio non importa da dove inizi. Le probabilità per un 18enne sono 3 volte superiori a quelle per un 17enne. O le probabilità per un 17enne sono 1/3 di quelle di un 18enne. Stessa cosa. Se si desidera ottenere la probabilità che venga impiegata una persona di una determinata età, è possibile utilizzare la formula con le stime dei parametri (non gli OR). Oppure puoi ottenere il programma che stai utilizzando per farlo per te.

2) Se il centraggio aiuta è una questione di opinione. Non trovo più chiari i modelli centrati, ma alcune persone lo fanno.

3) Le probabilità non sono esattamente le stesse di "probabili" (anche se molte persone parlano come se lo fossero) e le probabilità per un 17enne sarebbero 27 volte superiori a quelle di un 14enne.

Infine, sarei cauto su questo modello. Il modello presuppone che l'OR sia lo stesso tra 14 e 15, 15 e 16 e così via. Mi sembra improbabile, in base a ciò che so sull'argomento.


0

La probabilità media di iscriversi al problema di allenamento per un individuo è # volte la probabilità per un altro individuo di un anno più giovane / più grande, dopo aver mantenuto costanti tutte le altre variabili.

Questa è la mia opinione.


1
Puoi espandere come questo si aggiunge alla risposta precedente?
mdewey,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.