Interpretazione dell'output di regressione logistica in R


13

Sto lavorando a una regressione logistica multipla in R utilizzando glm. Le variabili predittive sono continue e categoriche. Un estratto del riepilogo del modello mostra quanto segue:

Coefficients:
               Estimate Std. Error z value Pr(>|z|)
(Intercept)   2.451e+00  2.439e+00   1.005   0.3150
Age           5.747e-02  3.466e-02   1.658   0.0973 .
BMI          -7.750e-02  7.090e-02  -1.093   0.2743
...
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Intervalli di confidenza:

                  2.5 %       97.5 %
(Intercept)  0.10969506 1.863217e+03
Age          0.99565783 1.142627e+00
BMI          0.80089276 1.064256e+00
...

Rapporti dispari:

                 Estimate Std. Error   z value Pr(>|z|)
(Intercept)  1.159642e+01  11.464683 2.7310435 1.370327
Age          1.059155e+00   1.035269 5.2491658 1.102195
B            9.254228e-01   1.073477 0.3351730 1.315670
...

Il primo output mostra che è significativa. Tuttavia, l'intervallo di confidenza per include il valore 1 e il rapporto di probabilità per è molto vicino a 1. Cosa significa il valore p significativo dal primo output? è un predittore del risultato o no?A g e A g e A g eAgeAgeAgeAge


8
È significativo solo al livello di confidenza del 10%, ma gli intervalli di confidenza sono del 5%.
Nick Sabbe,

Quindi gli intervalli di confidenza per il 10% non includeranno 1 allora?
SabreWolfy,

Il valore p (ultima colonna prima tabella) è la possibilità che il risultato ottenuto o peggio sarebbe raggiunto se l'ipotesi nulla fosse vera. L'intervallo di confidenza è una / la regione che conterrà il valore reale, ad es. Il 95% delle volte. Se non mantiene il valore vero ipotizzato, allora c'è al massimo il 5% di probabilità che otterremmo il risultato ottenuto o peggio, se l'ipotesi è vera. Quindi questo implicherebbe che il tuo valore p sia inferiore al 5%. Esiste una relazione molto stretta tra i valori p e gli intervalli di confidenza (statistiche 101). Ma in breve: sì, l'IC del 10% includerà 1.
Nick Sabbe,

Sembra che tu stia assumendo la linearità. Come è giustificato?
Frank Harrell,

Risposte:


8

Ci sono una serie di domande qui sul sito che aiuteranno con l'interpretazione dell'output dei modelli (qui ci sono tre diversi esempi, 1 2 3 , e sono sicuro che ce ne sono altri se si scava l'archivio). Ecco anche un tutorial sul sito web delle statistiche dell'UCLA su come interpretare i coefficienti di regressione logistica.

Sebbene il rapporto di probabilità per il coefficiente di età sia vicino a uno, ciò non significa necessariamente che l'effetto sia piccolo (se un effetto è piccolo o grande è spesso tanto una questione normativa quanto empirica). È necessario conoscere la variazione tipica dell'età tra le osservazioni per formulare un'opinione più informata.


Grazie per il link al tutorial, che sembra completo. Ho cercato qui prima di pubblicare la mia domanda. I collegamenti 1 e 3 sembrano non essere correlati alla mia domanda.
SabreWolfy,

@SabreWolfy, il link 1 chiarisce ulteriormente come interpretare i coefficienti in termini di unità originali, il link 3 descrive i passaggi per interpretare gli effetti in termini di probabilità (che è realmente applicabile alla tua domanda, e le trame suggerite in quella domanda sarebbero una risposta ragionevole per me dicendo che la dimensione dell'effetto diretto è difficile da interpretare senza conoscere la variazione dell'età).
Andy W,

5
Supponendo che l'età sia misurata in anni, quindi un rapporto di probabilità di 1.059 implica una differenza di probabilità tra un 20enne e un di . Non lo definirei un piccolo effetto. Tuttavia, ho implicitamente supposto che stavi parlando di umani. Se invece questi sono topi, una durata di 30 anni non è molto utile e dovrai cambiare di conseguenza la valutazione della dimensione dell'effetto. (1.059301)×100%=458%
Maarten Buis,

Il collegamento UCLA è morto, ma questo probabilmente corrisponde (almeno il suo aiuto contenuti me capire questa domanda).
MBR,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.