Dimensione dell'effetto al test di rango firmato Wilcoxon?


18

Alcuni autori (ad es. Pallant, 2007, p. 225; vedi immagine sotto) suggeriscono di calcolare la dimensione dell'effetto per un test di rango firmato da Wilcoxon dividendo la statistica del test per la radice quadrata del numero di osservazioni:

r=ZnX+ny

Zè l'output statistico del test di SPSS (vedi immagine sotto) e di wilcoxsign_testR. (Vedi anche la mia domanda correlata: teststatistic vs linearstatistic in wilcoxsign_test )

Altri suggeriscono il Bravais-Pearson ( ) o coefficienti dicorrelazione diSpearman (rS) (a seconda del tipo di dati).r=cov(XY)Sd(X)×Sd(Y)rS

Quando li calcoli, i due rnon sono nemmeno lontanamente uguali. Ad esempio, per i miei dati attuali:

r = 0,23 (per )r=ZnX+ny

r = 0.43 (Pearson)

Ciò implicherebbe dimensioni dell'effetto piuttosto diverse.

Quindi qual è la dimensione dell'effetto corretta da usare e come si relazionano le due rs?


Pagine 224 (parte inferiore) e 225 da Pallant, J. (2007). Manuale di sopravvivenza SPSS:

inserisci qui la descrizione dell'immagine

inserisci qui la descrizione dell'immagine


1
Glen_b

3
Preferirei piuttosto lasciarlo così com'è - se Bravais merita credito in una lingua, se lo merita in un'altra! Apprezzo il riempimento di una lacuna nella mia istruzione.
Glen_b

1
Sì, perché ho bisogno di un test in grado di gestire i legami.

2
nnn=nX+ny

1
Personalmente ho pensato che Z / sqrt (n) potesse essere un'opzione. Wikipedia su Mann-Whitney si collega a un documento pdf di Kirby che considera anche Wilcoxon accoppiato; Non ho letto l'articolo da solo.
ttnphns,

Risposte:


6
  • Se non hai legami, segnalerei la percentuale di valori successivi che sono inferiori ai corrispondenti valori precedenti.
  • Se si hanno legami, è possibile riportare la percentuale di valori after che sono inferiori rispetto a prima rispetto al numero totale di coppie non legate, oppure riportare tutte e tre le proporzioni (<, =,>) e forse la somma di qualunque delle due più significativo. Ad esempio, si potrebbe dire che "il 33% ha avuto meno paura delle statistiche, il 57% è rimasto invariato e il 10% ha avuto più paura dopo il corso in modo tale che il 90% fosse uguale o migliore di prima".

NzNz/Nz/N

C'è un'altra ruga, però. Mentre si desidera una stima della dimensione dell'effetto complessivo, le persone in genere utilizzano il test di rango firmato Wilcoxon con dati che sono solo ordinali. Cioè, dove non si fidano che i dati possano indicare in modo affidabile l'entità del turno all'interno di uno studente, ma solo che si è verificato un cambiamento. Questo mi porta alla proporzione migliorata discussa sopra.


D'altra parte, se ti fidi che i valori sono intrinsecamente significativi (ad esempio, hai usato solo il test di rango con segno per la sua solidità alla normalità e ai valori anomali), potresti semplicemente usare una media cruda o una differenza mediana o la differenza media standardizzata come misura di effetto.


2
+1 Le misure di effetto proposte sono facilmente comprensibili e anche correlate alla statistica del test.
Giovanni,

2

Senza sapere che tipo di dati sono stati valutati, è molto difficile dare buoni consigli qui. E davvero, questo è tutto ciò che puoi ottenere. Non esiste proprio la migliore misura della dimensione dell'effetto per domande come questa ... forse mai.

Le dimensioni dell'effetto menzionate nella domanda sono tutte dimensioni dell'effetto standardizzate. Ma è del tutto possibile che i mezzi o le mediane delle misure originali siano perfetti. Ad esempio, se stai misurando quanto tempo ci vuole per completare un processo di produzione, la differenza nei tempi dovrebbe essere una dimensione dell'effetto perfettamente ragionevole. Eventuali cambiamenti nel processo, misurazioni future, misurazioni tra sistemi e misurazioni tra fabbriche, saranno tutti in tempo. Forse vuoi la media o forse vuoi la mediana, o anche la modalità, ma la prima cosa che devi fare è guardare la scala di misurazione effettiva e vedere se la dimensione dell'effetto è ragionevole da interpretare e fortemente connessa alla misura.

Per aiutare a pensarci, gli effetti che dovrebbero essere standardizzati sono cose che sono misurate più indirettamente e in molti modi. Ad esempio, le scale psicologiche possono variare nel tempo e in molti modi e tentare di ottenere una variabile sottostante che non viene valutata direttamente. In questi casi si desidera ottenere dimensioni di effetto standardizzate.

Con le dimensioni standard degli effetti, il problema critico non è solo quale utilizzare, ma cosa significano. Come insinui nella tua domanda, non sai nemmeno cosa significano e questa è la cosa critica. Se non sai quale sia l'effetto standardizzato, non puoi segnalarlo correttamente, interpretarlo correttamente o utilizzarlo correttamente. Inoltre, se ci sono vari modi in cui vorresti discutere i dati, non c'è assolutamente nulla che ti impedisca di segnalare più di una dimensione di effetto. Puoi discutere i tuoi dati in termini di relazione lineare, come con la correlazione del momento del prodotto, o in termini di relazione tra i ranghi con Spearmanre le differenze tra questi o semplicemente fornire tutte le informazioni nella tabella. Non c'è niente di sbagliato in questo. Ma più che altro dovrai decidere cosa significano i tuoi risultati. È qualcosa a cui non è possibile rispondere dalle informazioni fornite e potrebbe richiedere molte più informazioni e conoscenze specifiche del dominio di quanto sia ragionevole per una domanda in questo tipo di forum.

E pensa sempre meta-analiticamente a come stai segnalando gli effetti. Le persone in futuro saranno in grado di ottenere i risultati che sto segnalando e integrarli con gli altri? Forse c'è uno standard nel tuo campo per queste cose. Forse hai selezionato un test non parametrico principalmente perché non ti fidi delle conclusioni che altri hanno fatto sulle distribuzioni sottostanti e vuoi essere più conservativo nei tuoi presupposti in un campo che utilizza principalmente i test parametrici. In tal caso non c'è nulla di sbagliato nel fornire inoltre una dimensione dell'effetto tipicamente usata con i test parametrici. Queste e molte altre questioni devono essere considerate quando si pensa a come collocare le proprie scoperte in una letteratura più ampia di ricerche simili. Statistiche descrittive generalmente buone risolvono questi problemi.

Questo è il consiglio principale. Ho qualche commento aggiuntivo. Se vuoi che la tua dimensione dell'effetto sia fortemente correlata al test che hai fatto, la Zraccomandazione basata è ovviamente la migliore. La dimensione dell'effetto standardizzata significherà la stessa cosa del test. Ma non appena non lo fai, non c'è niente di sbagliato nell'usare quasi tutto il resto, anche qualcosa come quello di Cohen dassociato ai test parametrici. Non si presuppone la normalità per il calcolo di mezzi, deviazioni standard odpunteggi. In effetti, ci sono ipotesi più deboli rispetto al coefficiente di correlazione raccomandato. E riporta sempre buone misure descrittive. Anche in questo caso, le misure descrittive non hanno ipotesi che violeresti, ma tieni presente il loro significato sostanziale. Riferisci statistiche descrittive che dicono qualcosa sui tuoi dati che vuoi dire e mezzi e mediane dicono cose diverse.

Se vuoi discutere misure ripetute rispetto a dimensioni di effetti di design indipendenti, questa è davvero una domanda completamente nuova.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.