Sto cercando correlazioni tra le risposte a diverse domande in un sondaggio ("umm, vediamo se le risposte alla domanda 11 sono correlate a quelle della domanda 78"). Tutte le risposte sono categoriche (la maggior parte di esse va da "molto infelice" a "molto felice"), ma alcune hanno un diverso insieme di risposte. Molti di essi possono essere considerati ordinali, quindi consideriamo questo caso qui.
Dato che non ho accesso a un programma di statistiche commerciali, devo usare R.
Ho provato Rattle (un pacchetto di data mining freeware per R, molto elegante) ma sfortunatamente non supporta i dati categorici. Un trucco che potrei usare è importare in R la versione codificata del sondaggio che ha numeri (1..5) invece di "molto infelice" ... "felice" e lasciare che Rattle creda che siano dati numerici.
Stavo pensando di fare un diagramma a dispersione e avere la dimensione del punto proporzionale al numero di numeri per ogni coppia. Dopo aver cercato su Google ho trovato http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/ ma mi sembra molto complicato (per me).
Non sono uno statistico (ma un programmatore) ma ho avuto qualche lettura in merito e, se avessi capito bene, il rho di Spearman sarebbe appropriato qui.
Quindi la versione breve della domanda per chi ha fretta: c'è un modo per tracciare rapidamente il rho di Spearman in R ? Una trama è preferibile a una matrice di numeri perché è più facile da guardare e può anche essere inclusa nei materiali.
Grazie in anticipo.
PS Ho riflettuto per un po 'se pubblicare questo sul sito SO principale o qui. Dopo aver cercato la correlazione R in entrambi i siti, ho ritenuto che questo sito fosse più adatto alla domanda.