Segnalazione dei risultati di una regressione logistica


13

Ho il seguente output di regressione logistica:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   0.5716     0.1734   3.297 0.000978 ***
R1           -0.4662     0.2183  -2.136 0.032697 *  
R2           -0.5270     0.2590  -2.035 0.041898 *  

È opportuno segnalarlo nel modo seguente:

Coefficiente beta, Odds ratio, Zvalue, valore P. Se sì, come posso ottenere il Odds ratio?


Risposte:


9

Il rapporto suggerito per una tabella sembra ragionevole, sebbene i valori z e i valori p siano ridondanti. Molte riviste con cui ho familiarità non riportano affatto il valore z / valore p e usano solo asterischi per segnalare significati statistici. Ho anche visto le tabelle logistiche solo con i rapporti di dispari riportati, anche se personalmente preferisco sia le quote di registro sia i rapporti di probabilità riportati se lo spazio lo consente in una tabella.

Ma luoghi diversi possono avere guide diverse sulle procedure di segnalazione, quindi ciò che ci si aspetta può variare. Se invio un articolo a un diario vedrò spesso come altri articoli recenti hanno fatto i loro tavoli e li imito. Se si tratta di un documento personale, chiedere a chiunque stia recensendo sarebbe una richiesta ragionevole. Come accennato in precedenza, i vincoli di spazio in alcuni luoghi potrebbero impedirti di riportare informazioni in definitiva ridondanti (come sia le probabilità del registro che i rapporti di probabilità). Alcuni luoghi potrebbero costringerti a riportare i risultati interamente in testo!

C'è anche la domanda su quali altri modelli di sintesi riportare. Sebbene molte riviste con cui ho familiarità riferiscano spesso valori pseudo , ecco un thread sul sito che discute i punti deboli di varie misure. Personalmente preferisco comunicare i tassi di classificazione, ma sospetto che ciò vari in base alla sede (posso immaginare che alcune riviste chiedano specificamente che venga segnalata una delle pseudo misure R 2 ).R2R2

eβ^eβ^exp(coefficient)

Anche come nota, sebbene questa sia la risposta attualmente accettata, lejohn e Frank Harrell forniscono entrambi consigli molto utili. Mentre in genere vorrei sempre che le statistiche nella domanda fossero riportate da qualche parte, le altre risposte ai consigli su altre misure sono modi utili per valutare le dimensioni degli effetti rispetto ad altri effetti stimati nel modello. Le procedure grafiche sono utili anche per esaminare le dimensioni degli effetti relativi e vedere questi due articoli sulla trasformazione delle tabelle in grafici come esempi ( Kastellec & Leoni, 2007 ; Gelman et al., 2002 )


Il link di Kastellec & Leoni, 2007 è rotto, ma ecco un esempio dallo stesso documento con il codice.
ACNB,

11

La risposta a questa domanda potrebbe dipendere dal tuo background disciplinare.

Ecco alcune considerazioni generali.

Le beta nella regressione logistica sono piuttosto difficili da interpretare direttamente. Pertanto, segnalarli esplicitamente è solo di uso molto limitato. Dovresti attenersi ai rapporti di probabilità o anche agli effetti marginali. L'effetto marginale della variabile x è la derivata della probabilità che le variabili dipendenti siano uguali a 1, rispetto a x. Questo modo di presentare i risultati è molto popolare tra gli economisti. Personalmente credo che gli effetti marginali siano più facilmente comprensibili dai laici (ma non solo da loro ...) rispetto ai rapporti di probabilità.

Un'altra possibilità interessante è quella di utilizzare display grafici. Un luogo in cui troverai alcune illustrazioni di questo approccio è il libro di Gelman e Hill . Lo trovo ancora migliore rispetto alla segnalazione di effetti marginali.

Per quanto riguarda la domanda su come ottenere i rapporti di probabilità, ecco come puoi farlo in R:

model <- glm(y ~ x1 + x2, family=binomial("logit"))
oddrat <- exp(coef(model))

Hai qualche esempio di trasformare le stime dell'effetto marginale in tabelle (o riferimenti a pagine specifiche in Gelman e Hill?)
Andy W

1
Gelman e Hill non usano realmente gli effetti marginali, ma piuttosto i grafici, che si basano sulle probabilità previste.

10

È solo in casi speciali in cui i coefficienti e i loro anti-log (odds ratio) sono buoni riassunti. Questo è quando le relazioni sono lineari e c'è un coefficiente associato a un predittore, e quando un cambiamento di una unità è una buona base per calcolare il rapporto delle probabilità (più OK per l'età, non tanto per l'emocromo con un intervallo di 500-100,000). In generale, cose come i rapporti di probabilità tra i quartili sono utili. Ho maggiori dettagli a riguardo su http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf e il rmspacchetto R fa tutto automaticamente (gestendo termini e interazioni non lineari, calcola quartili di X, eccetera.).


5

Probabilmente dipende dal tuo pubblico e dalla tua disciplina. La risposta che segue è ciò che viene normalmente fatto per le riviste di epidemiologia e, in misura minore, per le riviste di medicina.

Ad essere sinceri, non ci importa dei valori p. Seriamente, non lo facciamo. L'epidemiologia non ti permetterà nemmeno di segnalarli a meno che tu non abbia un'esigenza davvero, davvero pressante, e il campo ha sostanzialmente seguito l'esempio.

Potremmo non preoccuparci nemmeno delle stime beta, a seconda della domanda. Se il tuo rapporto è su qualcosa di più metodologico o orientato alla simulazione, probabilmente segnalerei la stima beta e l'errore standard. Se stai cercando di segnalare un effetto come stimato nella popolazione, rimarrei con Odds Ratio e intervallo di confidenza al 95%. Questa è la carne della tua stima, e ciò che i lettori in quel campo cercheranno.

Le risposte sono state postate sopra per come ottenere il rapporto di probabilità, ma per OR e IC al 95%:

OR = exp(beta)
95% CI = exp(beta +/- 1.96*std error)

Grazie per la risposta! posso chiedere cosa rappresenta 1.96 nel calcolo?
fino al

1
Nessun problema :) L'intervallo di confidenza al 95% è l'intervallo che dovrebbe coprire approssimativamente dal 2,5 ° percentile al 97,5 ° percentile della normale distribuzione della tua stima beta. Ognuno di questi punti è circa 1,96 deviazioni standard dalla media (in questo caso, beta).
Fomite,

sì, ma dovrei farlo per ogni coefficiente beta? cambia anche l'1,96? anche questi sono dati binomiali è ancora basato sulla normale distribuzione?
fino al

2
Sì - per ciascun coefficiente beta, è possibile ottenere un odds ratio e un limite di confidenza del 95%. L'1,96 non cambierà a meno che non si desideri calcolare un percentile diverso per l'intervallo di confidenza (90%, 99%, ecc.), Ma poiché il 95% è standard, non è necessario farlo. E fintanto che si lavora sulla scala del registro, i parametri di un modello di regressione logistica sono normalmente distribuiti. Una volta esponenti, questo smette di essere vero.
Fomite,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.