G-test vs test chi-quadrato di Pearson


10

Sto testando l'indipendenza in una tabella di contingenzaNon so se il G-test o il test chi-quadrato di Pearson siano migliori. La dimensione del campione è in centinaia ma ci sono alcuni conteggi di celle bassi. Come indicato nella pagina di Wikipedia , l'approssimazione alla distribuzione chi-quadrata è migliore per il test G che per il test chi-quadrato di Pearson. Ma sto usando la simulazione Monte Carlo per calcolare il valore p, quindi c'è qualche differenza tra questi due test?N×M


Risposte:


8

Sono asintoticamente uguali. Sono solo modi diversi di ottenere la stessa idea. Più specificamente, il test chi-quadrato di Pearson è un test del punteggio, mentre il G-test è un test del rapporto di verosimiglianza. Per avere un'idea più precisa di queste idee, può aiutarti a leggere la mia risposta qui: Perché i miei valori p differiscono tra l'output di regressione logistica, il test chi-quadrato e l'intervallo di confidenza per l'OR? Per rispondere alla tua domanda diretta, se stai calcolando il valore p con la simulazione Monte Carlo, non dovrebbe importare; potresti semplicemente usare quello che è più conveniente per te. Si noti che non vi è alcun problema con conteggi di celle basse, previsto solo (potenzialmente) bassoconta delle cellule; è possibile avere conteggi di cellule basse e conteggi previsti che vanno bene. Inoltre, né i conteggi effettivi bassi né i conteggi attesi bassi contano quando il valore p è determinato dalla simulazione.

(Per quello che vale, probabilmente userò il chi-quadrato di Pearson, perché R ha una funzione conveniente per ciò che include l'opzione di simulare il valore p.)


qual è la funzione in R?
Llewmills,

@llewmills, chisq.test.
gung - Ripristina Monica


-1

Il test chi-quadro e il test G di solito producono risultati simili. Ma la cosa più importante qui è che devi scegliere uno dei due test e seguirlo, non solo per il tuo test menzionato ma per i test futuri nel corso della tua ricerca. È consigliabile perché se si tenta di utilizzare entrambi i test in modo intercambiabile, è molto probabile che aumenti la possibilità di ottenere falsi positivi.


2
Qual è il ragionamento con cui aumenta l'affermazione che aumenta la possibilità di un falso positivo? (A meno che tu non abbia intenzione di suggerire che il test sia scelto facendo riferimento ai conteggi effettivi, ma è quindi il riferimento ai conteggi a scegliere tra questi è il problema, piuttosto che l'idea di scambiare i test di per sé)
Glen_b -Reinstate Monica

2
@Glen_b La probabilità di ottenere un falso positivo aumenta probabilmente se scegliamo un valore p del test più favorevole ai nostri presupposti (nel caso in cui proviamo entrambi i test)
little_monster
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.