(Grazie mille per le risposte rapide! Ho fatto un pessimo lavoro nel porre la domanda, quindi lasciami riprovare.)
Non so come scoprire se la differenza tra due correlazioni di Spearman sia statisticamente significativa. Vorrei sapere come scoprirlo.
La ragione che volevo scoprire è che nel seguente documento: Semantic Interpretation for Natural Language Processing , basato su Wikipedia , di Gabrilovich e Markovitch ( Journal of Artificial Intelligence Research 34 (2009) 443-498).
Nella Tabella 2 (p. 457), gli autori stanno dimostrando che il loro metodo (ESA-Wikipedia) raggiunge una correlazione di Spearman più elevata e statisticamente significativa rispetto ad altri metodi, e vorrei fare lo stesso per dimostrare che il mio metodo è migliore del precedente metodi per qualche problema.
Non so come abbiano calcolato il significato statistico e vorrei saperlo. L'autore dell'articolo ha affermato che la correlazione tra gradi di Spearman è stata trattata come correlazione di Pearson. Non sono sicuro che sia il modo giusto per farlo. Ho due correlazioni di Spearman e vorrei sapere se la differenza tra loro è statisticamente significativa o meno.
Sono consapevole che i siti Web, come http://faculty.vassar.edu/lowry/rdiff.html , forniscono un calcolatore online per ottenere la differenza tra due correlazioni di Pearson. Non riesco a trovare un calcolatore online simile per la differenza tra due correlazioni di Spearman.
Una soluzione dal collegamento fornito da Peter Flom
NOTA: le procedure supportano solo le correlazioni di Spearman inferiori a 0.6.
Let = Fisher trasformata di correlazione osservata di serie A , z B = Fisher trasformata di correlazione osservata del set B .
Per , let y A i = n z A - ( n - 1 ) z A ′ i , dove z A ′ i è la trasformata di Fisher dell'insieme A della correlazione a sinistra sinistra ottenuta da eliminazione ( x i , y i ) , nuova classificazione e nuova elaborazione della correlazione. (Ogni z A ′ i si basa su n - paio; ogni eliminazione è temporaneo, per ciò che io solo, non è permanente.) Ripetere per il set B .
è la trasformata di Fisher con jackknifed. Ripetere l'operazione per setB.
è la varianza di ˉ y A . Ripetere l'operazione per set B .
Utilizzare un heteroscedastic (Welch-Satterthwaite) -test per confrontare le due stime jackknifed:
dovenAenBsono il numero di campioni di serieAeBrispettivamente.
Prima della prima modifica
Ho una serie di classifiche classificate dall'uomo (HUMAN-RANKING), una serie di classifiche generate dal metodo popolare attualmente utilizzato (PRESENT-RANKING) e infine una serie di classifiche generate dal mio metodo intenzionale (MY-RANKING) .
Ho calcolato la correlazione di Spearman tra HUMAN-RANKING e PRESENT-RANKING. Vorrei chiamare questo: HUMAN-PRESENT-SPEARMAN.
Ho quindi scoperto la correlazione di Spearman tra HUMAN-RANKING e MY-RANKING. Vorrei chiamare questo: HUMAN-MY-SPEARMAN.
Come posso scoprire se la differenza tra HUMAN-MY-SPEARMAN e HUMAN-PRESENT-SPEARMAN è statisticamente significativa?