Regressione logistica vs chi-quadrato in una tabella di contingenza 2x2 e Ix2 (fattore singolo - risposta binaria)?


10

Sto cercando di capire l'uso della regressione logistica nelle tabelle di contingenza 2x2 e Ix2. Ad esempio, usando questo come esempio

inserisci qui la descrizione dell'immagine

Qual è la differenza tra l'utilizzo del test chi-quadro e l'uso della regressione logistica? Che dire di una tabella con più fattori nominali (tabella Ix2) come questa:

inserisci qui la descrizione dell'immagine

C'è una domanda simile qui - ma la risposta è principalmente che chi-square può gestire tabelle mxn, ma la mia domanda è a cosa serve specificalyl quando c'è un risultato binario e un singolo fattore nominale. (Anche il thread collegato fa riferimento a questo thread , ma si tratta di variabili / fattori multipli).

Se è solo un singolo fattore (cioè non è necessario controllare altre variabili) con una risposta binaria, qual è la differenza di scopo nel fare la regressione logistica?


+1 per la domanda, ma è necessario facilitare la copia e l'incollamento dei dati per lavorare con essa.
Antoni Parellada,

2
Vedi Perché i miei valori p differiscono tra l'output di regressione logistica, il test chi-quadrato e l'intervallo di confidenza per l'OR? . Il test chi-quadrato di Pearson per associazione è solo il test del punteggio per l'ipotesi nulla che tutte le pendenze siano zero. Il test del rapporto di verosimiglianza corrispondente è asintoticamente equivalente. Come dice @Kodiologist, gli usi ai quali si potrebbe porre la regressione logistica sono più ampi dei test che tutte le pendenze sono zero.
Scortchi - Ripristina Monica

Risposte:


12

In definitiva, sono mele e arance.

La regressione logistica è un modo per modellare una variabile nominale come risultato probabilistico di una o più altre variabili. L'adattamento di un modello di regressione logistica potrebbe essere seguito da una verifica se i coefficienti del modello sono significativamente diversi da 0, calcolando gli intervalli di confidenza per i coefficienti o esaminando la capacità del modello di prevedere nuove osservazioni.

Il of² test di indipendenza è un test di significatività specifica che verifica l'ipotesi nulla che due variabili nominali siano indipendenti.

L'eventuale necessità di utilizzare la regressione logistica o un test χ² dipende dalla domanda a cui si desidera rispondere. Ad esempio, un test di χ² potrebbe verificare se è irragionevole credere che il partito politico registrato di una persona sia indipendente dalla sua razza, mentre la regressione logistica potrebbe calcolare la probabilità che una persona con una determinata razza, età e sesso appartenga a ciascun partito politico .


Grazie. Saresti in grado di darmi un esempio del diverso tipo di domande a cui puoi rispondere con i diversi metodi? Esistono risorse specifiche che puoi consigliare per comprendere le diverse domande alle quali è possibile rispondere con i due metodi?
L Xandor,

Ho aggiunto esempi alla mia risposta. Per quanto riguarda la tua seconda domanda, Wikipedia è un posto decente per iniziare. Inoltre, la maggior parte dei manuali introduttivi sulle statistiche applicate menzionerà sia il test di indipendenza che la regressione logistica.
Kodiologo,

Grazie. Non sono ancora chiaro quale sia la differenza nel caso specifico di una tabella di contrapposizione 2x2? chi square verificherebbe se il risultato è indipendente dalle variazioni del fattore, ma cosa fa qui la regressione logistica? Capisco che LR è utile per fare previsioni basate su una serie di fattori, ma quando si tratta del semplice 2x2 non sono sicuro di quale sia la differenza (ma è chiaramente usata) ... tu (o chiunque) potresti usare il 2x2 tabella stress / reflusso nel post originale come esempio concreto di come verrebbero usati diversamente? È il caso a singolo fattore che mi interessa di più
L Xandor il

o la razza / partito politico funziona altrettanto bene come esempio, ma quando poi usi la regressione logistica stai usando più fattori, e posso vedere come è utile lì ... ma quello che ho difficoltà a capire è perché usa LR (o come è diverso) nel caso del singolo fattore. Se entrambi i metodi vengono utilizzati per esaminare la relazione tra razza e partito politico, qual è la differenza tra chi square e la regressione logistica?
L Xandor,

Nel caso dell'esempio di stress e reflusso, è possibile utilizzare la regressione logistica per verificare se lo stress influisce in modo significativo sulla probabilità di reflusso oppure è possibile calcolare un intervallo di confidenza per il rapporto di probabilità che esprime questo effetto. Un modo in cui ciò è concettualmente diverso da un test di χ² è quello di stress o reflusso che viene interpretato come variabile dipendente. Ma in ogni caso, la regressione logistica può essere considerata eccessiva per una tabella di contingenza 2 per 2.
Kodiologo il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.