U-test di Mann-Whitney: intervallo di confidenza per la dimensione dell'effetto


13

Secondo Fritz, Morris e Richler (2011; vedi sotto), può essere calcolato come una dimensione dell'effetto per il test U di Mann-Whitney usando la formula r = zr Questo è conveniente per me, poiché riportoranche in altre occasioni. Vorrei segnalare l'intervallo di confidenza perr

r=zN
rr oltre alla misura della dimensione dell'effetto.

Ecco le mie domande :

  • Posso calcolare gli intervalli di confidenza per r come per r di Pearson, sebbene sia usato come misura delle dimensioni dell'effetto per un test non parametrico?
  • Quali intervalli di confidenza devono essere segnalati per i test a una coda o a due code?

Modifica relativa alla seconda domanda: "Quali intervalli di confidenza devono essere segnalati per i test a una coda o a due code?"

Ho trovato alcune ulteriori informazioni che IMHO potrebbe rispondere a questa domanda. "Considerando che i limiti di confidenza bilaterale formano un intervallo di confidenza, le loro controparti unilaterali sono denominate limiti di confidenza inferiore o superiore." ( http://en.wikipedia.org/wiki/Confidence_interval ). Da queste informazioni, concludo che non è il problema principale se il test di significatività (ad esempio, test ) sia a una o due code, ma quali informazioni sono interessate rispetto all'IC per la dimensione dell'effetto. La mia conclusione (per favore correggimi se non sei d'accordo):t

  • CI a due facce interessato alla parte superiore e limiti inferiore (di conseguenza, è possibile che un CI bilaterale implichi 0 sebbene il test di significatività a una coda fosse p <.05, soprattutto nel caso in cui il valore fosse vicino. 05.)
  • "CI" unilaterale interessato solo al limite superiore o inferiore (per ragioni teoriche); tuttavia, questa non è necessariamente la principale questione di interesse dopo aver verificato un'ipotesi diretta. Un CI a due facciate è perfettamente appropriato se il focus è sulla possibile gamma di una dimensione dell'effetto. Giusto?

Vedi sotto per il passaggio di testo di Fritz, Morris e Richler (2011) sulla stima delle dimensioni degli effetti per il test di Mann-Whitney dall'articolo a cui mi riferisco sopra.

"La maggior parte delle stime sulla dimensione dell'effetto che abbiamo descritto qui presuppone che i dati abbiano una distribuzione normale. Tuttavia, alcuni dati non soddisfano i requisiti dei test parametrici, ad esempio i dati su una scala ordinale ma non a intervalli. Per tali dati, i ricercatori di solito si rivolgono a test statistici non parametrici, come i test di Mann-Whitney e Wilcoxon. Il significato di questi test viene di solito valutato attraverso l'approssimazione delle distribuzioni delle statistiche dei test alla distribuzione quando le dimensioni del campione non sono troppo piccole e statistiche i pacchetti, come SPSS, che eseguono questi test riportano il valore z appropriato oltre ai valori per U o T ;zzUTzpuò anche essere calcolato a mano (ad es. Siegel & Castellan, 1988). Il valore può essere usato per calcolare una dimensione dell'effetto, come la r proposta da Cohen (1988); Le linee guida di Cohen per r sono che un effetto grande è .5, un effetto medio è .3 e un effetto piccolo è .1 (Coolican, 2009, p. 395). È facile calcolare r , r 2 o η 2 da questi valori z perché r = zzrrr2η2z e r2

r=zN
Queste stime sulla dimensione dell'effetto rimangono indipendenti dalla dimensione del campione nonostante la presenza di N nelle formule. Questo perché z è sensibile alle dimensioni del campione; la divisione per una funzione di N rimuove l'effetto della dimensione del campione dalla stima della dimensione dell'effetto risultante. "(p. 12)
r2orη2=z2N

Risposte:


9

Una scelta della dimensione dell'effetto per il test U di Mann-Whitney è la dimensione dell'effetto del linguaggio comune. Per la Mann-Whitney U, questa è la proporzione di coppie di campioni che supporta un'ipotesi dichiarata.

Una seconda scelta è la correlazione tra gradi; poiché la correlazione tra gradi varia da -1 a +1, ha proprietà simili a Pearson r. Inoltre, con la semplice formula della differenza, la correlazione tra gradi è la differenza tra la dimensione dell'effetto del linguaggio comune e il suo complemento, un fatto che promuove l'interpretazione. Ad esempio, se ci sono 100 coppie di campioni e se 70 coppie di campioni supportano l'ipotesi, la dimensione dell'effetto del linguaggio comune è del 70% e la correlazione dei ranghi è r = .70 = .30 = .40. Una chiara discussione sulla dimensione dell'effetto linguaggio comune e su quattro formule per calcolare la correlazione tra gradi è data da Kerby nella rivista Innovative Teaching: Kerby (2014) Innovative Teaching

A proposito, anche se il documento non lo menziona, sono abbastanza certo che Somers d e la correlazione tra ranghi per Mann-Whitney siano equivalenti.


1
Intendi "Ad esempio, se ci sono 100 coppie possibili "? Il test U di Mann-Whitney è per dati non accoppiati, quindi il fraseggio è ambiguo - potresti voler chiarire ai lettori quali sono le possibili coppie.
gung - Ripristina Monica

1
Grazie per il commento e la possibilità di chiarire. Ho fatto riferimento a coppie di campioni . Se ci sono 10 osservazioni nel campione sperimentale e se ci sono 10 osservazioni nel campione di controllo, allora ci sono 10 * 10 = 100 coppie di campioni . Secondo Robert Grissom, la dimensione dell'effetto del campione è uno stimatore imparziale della dimensione dell'effetto della popolazione. Pertanto, se la correlazione di rango è r = .40 per il campione, si tratta di uno stimatore imparziale della dimensione dell'effetto della popolazione.
DSK,

Sospettavo fosse quello che volevi dire, @DSK. Penso che questa spiegazione aiuterà le persone. Potresti volerlo modificare nella tua risposta. Benvenuti nel CV.
gung - Ripristina Monica

8

Il tuo link mi dà l'opportunità di acquistare l'articolo.

cHmiscrcorr.censcDxyDxy=2×(c12)


Grazie per avermelo segnalato (link). Ho inserito il passaggio sul test di Mann-Whitney nella mia domanda.
grigio

Grazie mille per la tua risposta. Hai forse un link a portata di mano su come interpretare il c-index e Somers 'D? Sarei particolarmente interessato a sapere se quest'ultimo può essere interpretato paragonabile a r. Ho due campioni e nel secondo campione (N più grande e distribuzione normale) riporto r. Penso che faciliterebbe il confronto dei risultati se le misure utilizzate fossero simili, per quanto possibile, ovviamente. Ecco perché ero interessato alla formula menzionata da Fritz et al. (2011). Quindi l'IC per la loro r non può essere calcolato come per la r di Pearson suppongo? Mille grazie ancora!
grigio

zDxyYDc

Mille grazie per la tua risposta. Ho cercato ulteriori informazioni su come interpretare Somer, ma finora non ho avuto molto successo. Somer potrebbe essere compreso in modo simile al coefficiente di correlazione di Pearson, ad esempio la quadratura produce un coefficiente di determinazione? Sarei molto felice di trovare una misura della dimensione dell'effetto che possa essere interpretata in modo simile a r, se ne esiste una.
grigio

Ho trovato alcune ulteriori informazioni sulla formula r = Z / √ (N): Rosenthal (1991) scrive che "possiamo utilmente stimare una dimensione dell'effetto r solo dal livello ap fintanto che conosciamo la dimensione dello studio (N). Convertiamo la p ottenuta nel suo equivalente standard di deviazione normale usando una tabella di valori Z. "
grigio
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.