Il chi-quadrato è sempre un test unilaterale?


48

Un articolo pubblicato ( pdf ) contiene queste 2 frasi:

Inoltre, la dichiarazione errata può essere causata dall'applicazione di regole errate o dalla mancanza di conoscenza del test statistico. Ad esempio, il df totale in un ANOVA può essere considerato l'errore df nella segnalazione di un test , oppure il ricercatore può dividere il valore p riportato di un test o per due, al fine di ottenere un valore unilaterale , mentre il valore di un test o è già un test unilaterale.χ 2 F p p χ 2 FFχ2Fppχ2F

Perché avrebbero potuto dirlo? Il test chi-quadrato è un test su due lati. (Ho chiesto a uno degli autori, ma non ho ricevuto risposta.)

Sto trascurando qualcosa?


Guarda l'esercizio 4.14 dell'edizione 2004 di "Econometric Theory and Methods" di Davidson & Mackinnon per un esempio (eccezionale) di quando il Chi-quadrato viene utilizzato per un test a due code. Modifica: grande spiegazione qui: itl.nist.gov/div898/handbook/eda/section3/eda358.htm
Max

Risposte:


50

Il test chi-quadrato è essenzialmente sempre un test unilaterale . Ecco un modo libero di pensarci: il test chi-quadrato è fondamentalmente un test di "bontà di adattamento". A volte viene esplicitamente indicato come tale, ma anche quando non lo è, è spesso in sostanza una bontà di adattamento. Ad esempio, il test chi-quadrato di indipendenza su una tabella di frequenza 2 x 2 è (una sorta di) un test di bontà di adattamento della prima riga (colonna) alla distribuzione specificata dalla seconda riga (colonna) e viceversa , contemporaneamente. Pertanto, quando il valore del chi-quadrato realizzato si trova fuori dalla coda destra della sua distribuzione, indica uno scarso adattamento e, se è abbastanza lontano, rispetto ad una soglia prestabilita, potremmo concludere che è così scarso che non crediamo che i dati provengano da quella distribuzione di riferimento.

Se dovessimo utilizzare il test del chi-quadrato come test a due facciate, saremmo anche preoccupati se la statistica fosse troppo lontana nella parte sinistra della distribuzione del chi-quadrato. Ciò significherebbe che siamo preoccupati che l'adattamento potrebbe essere troppo buono . Questo non è semplicemente qualcosa di cui siamo in genere preoccupati. (Come nota a margine storica, questo è legato alla controversia sul fatto che Mendel abbia confuso i suoi dati. L'idea era che i suoi dati fossero troppo buoni per essere veri. Vedi qui per maggiori informazioni se sei curioso.)


9
+1 per menzionare l'uso su due lati con gli esperimenti sui piselli di Mendel: è memorabile e arriva al nocciolo della domanda.
whuber

2
+1 per una buona domanda e una risposta eccellente. @Joel W: Consiglio vivamente il video di Khan Academys sul testχ2
Max Gordon,

9
La mia sintesi di questo è che il è un test a due facce per il quale di solito siamo interessati solo a una delle code della distribuzione, che indica più disaccordo, piuttosto che meno disaccordo di quanto ci si aspetti per caso. χ2
Frank Harrell,

5
Supportando la vista a 2 code: "La probabilità di due code oltre +/- z per la distribuzione normale standard è uguale alla probabilità di coda destra sopra il quadrato z per la distribuzione chi-quadrato con df = 1. Ad esempio, il due- probabilità normale standard con coda di 0,05 che scende sotto -1,96 e sopra 1,96 è uguale alla probabilità chi-quadrata della coda destra sopra (1,96) quadrato = 3,84 quando df = 1. " Agresti, 2007 (2a edizione) pagina 11
Joel W.

5
Giusto. La quadratura di un punteggio z produce una variabile chi-quadrato. Ad esempio, az di 2 (o -2!) Quando il quadrato è uguale a 4, il corrispondente valore del chi-quadrato. Il valore p a due code associato a un punteggio z di 2 è .04550026; e il valore p a una coda associato a un valore chi-quadrato di 4 (df = 1) è 0,04550026. Un test z a due code corrisponde a un test chi-quadrato a una coda. Osservare la coda sinistra della distribuzione chi-quadrato corrisponderebbe alla ricerca di punteggi z più vicini a z = 0 di quanto ci si possa aspettare per caso.
gung - Ripristina Monica

12

Il chi-quadrato è sempre un test unilaterale?

Dipende davvero da due cose:

  1. quale ipotesi viene messa alla prova. Se stai testando la varianza dei dati normali rispetto a un valore specificato, è possibile avere a che fare con la coda superiore o inferiore del chi-quadrato (a una coda) o con entrambe le code della distribuzione. Dobbiamo ricordare che statistiche di tipo non sono le uniche prove chi-quadro in città!(OE)2E

  2. se le persone stanno parlando dell'ipotesi alternativa di essere a una o due facce (perché alcune persone usano "a due code" per riferirsi a un'alternativa a due facce, indipendentemente da ciò che accade con la distribuzione campionaria della statistica . Questo a volte può essere quindi, ad esempio, se stiamo esaminando un test delle proporzioni a due campioni, qualcuno potrebbe nel nulla scrivere che le due proporzioni sono uguali e in alternativa scrivere che| T | | T |π1π2e poi parlane come 'a due code', ma testalo usando un chi-quadrato piuttosto che uno z-test, e quindi guarda solo la coda superiore della distribuzione della statistica test (quindi è a due code in termini di la distribuzione della differenza nelle proporzioni del campione, ma una coda in termini di distribuzione della statistica chi-quadro ottenuta da ciò - più o meno allo stesso modo che se si effettua la statistica t-test , si è solo guardando una coda nella distribuzione di ).|T||T|

Vale a dire, dobbiamo stare molto attenti a ciò che intendiamo coprire con l'uso del "test chi-quadro" e preciso su cosa intendiamo quando diciamo "a una coda" vs "a due code".

In alcune circostanze (due di cui ho parlato; potrebbe essercene di più), può avere perfettamente senso chiamarlo a due code, oppure può essere ragionevole chiamarlo a due code se si accetta una certa scioltezza dell'uso della terminologia.

Può essere ragionevole affermare che è sempre una sola coda se si limita la discussione a particolari tipi di test chi-quadrati.



Grazie mille per aver menzionato il test di varianza. Questo è in realtà un uso abbastanza interessante del test, e anche il motivo per cui sono finito su questa pagina ^^
Tobbey

5

Il test chi-quadrato dell'ipotesi che la varianza sia può essere a una o due code esattamente nello stesso senso in cui il test t dell'ipotesi che la media sia può essere a una o due code.σ 2 ( m - μ ) (n1)s2/σ2σ2μ(mμ)n/sμ


1

χ2

χ2

Questa lettura significherebbe confondere il modo in cui è stata generata la statistica test con la quale vengono esaminate le code della statistica test .


Potresti approfondire quale sarebbe un "lato di una distribuzione originale"? Non è nemmeno evidente a cosa si riferisca quella "distribuzione originale" né come sia correlata alla statistica chi-quadro calcolata dai dati.
whuber

nχ2χ2

OK, ma non riesco ancora a capire con cosa stai contrastando. Potresti fornire un esempio di una statistica di test non bilaterale che potrebbe essere utilizzata in ANOVA e mostrare come è connessa con le code di una certa distribuzione?
whuber

χ2χ2χ2

Sto chiedendo un contrasto solo per aiutare a capire cosa stai cercando di descrivere. Non sono stato in grado di determinare cosa sia ancora.
whuber

0

Ho anche avuto alcuni problemi da affrontare anche con questa domanda, ma dopo un po 'di sperimentazione mi è sembrato come se il mio problema fosse semplicemente nel modo in cui i test sono chiamati.

In SPSS come esempio, una tabella 2x2 può avere un'aggiunta di un test chisquare. Vi sono due colonne per i valori p, una per "Pearson Chi-Sqare", "Continuity Correction" ecc. E un'altra coppia di colonne per l'esatto test di Fisher in cui sono presenti una colonna per un test fronte-retro e un'altra per un Test su un lato.

Per prima cosa ho pensato che i lati 1 e 2 denotassero una versione a 1 o 2 lati del test chisquare, che sembrava strano. Si è scoperto tuttavia che ciò denota la formulazione sottostante dell'ipotesi alternativa nel test di una differenza tra le proporzioni, cioè il test z. Quindi il test delle proporzioni su due lati spesso ragionevole viene raggiunto in SPSS con il test chisquare, in cui la misura chisquare viene confrontata con un valore nella coda superiore (1 facciata) della distribuzione. Suppongo che questo sia ciò che altre risposte alla domanda originale hanno già sottolineato, ma mi ci è voluto del tempo per rendermene conto.

A proposito, lo stesso tipo di formulazione viene utilizzato in openepi.com e possibilmente anche in altri sistemi.




-1

χ2χ2χ2

SSwdfw

χ2

Distribuzioni chi-quadro e F.


1
Una statistica di prova non ha bisogno di assumere valori negativi per noi per considerare entrambe le code. Considera un test F per il rapporto di due varianze, per esempio.
Glen_b

Il test F è un test unilaterale Glen_b.
Daniel

3
Il test F per l'uguaglianza delle varianze, che ha una statistica che è il rapporto tra le due stime di varianza NON è unilaterale; c'è un'approssimazione che posiziona la più grande delle due varianze del campione sul numeratore, ma è davvero giusto solo se il df è lo stesso. Ma se non ti piace, ci sono molti altri esempi. La statistica per il test somma somma non può essere negativa ma il test è a due code. Se necessario, posso fornire altri esempi.
Glen_b

σ12σ22σ12>σ22
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.