Per definizione, la scala ordinale è l'indicatore in cui le vere distanze tra le tacche 1 2 3 4
sono sconosciute. È come se stessi vedendo un sovrano sotto droghe / alcol. Le vere distanze possono essere qualsiasi. Potrebbe essere 1 2 3 4
o 1 2 3 4
o qualsiasi altra cosa. Non possiamo calcolare una statistica - come una correlazione - a meno che non decidiamo le distanze, fissarle.
Un ragionamento può essere il seguente. Poiché la nostra scala di misurazione, il misuratore, è distorta in un modo monotonico sconosciuto, non possiamo credere nei valori dei dati. Solo l'ordine delle loro magnitudini è degno di fiducia. Senza ulteriore imbracatura del cervello, dichiara che l'ordine è il valore. Pertanto, sostituiamo la distribuzione osservata con una distribuzione uniforme, i gradi . Successivamente, può calcolare il coefficiente di associazione, diciamo Pearson . Quello sarà Spearman , come sappiamo. Pearson misura la forza dell'associazione lineare. La classificazione delle variabili è stata un trucco per linearizzare quella parte della relazione monotonica attribuita alle distribuzioni che inizialmente non erano state uniformi. Quindi, Spearmanr h o r r h o rrr h orr h oè la misura di tale monotonicità nella relazione che può essere convertita in linearità sotto l'azione di uniformazione delle distribuzioni marginali. Nella domanda OP, solo una delle due variabili è ordinale (e la seconda è continua). Pertanto, non è necessario, in generale, classificare entrambe le variabili. Può solo classificare quello ordinale e quindi calcolare .r
Un altro approccio , alternativo alla classifica (uniforming), può essere il ridimensionamento ottimale della variabile ordinale. Il ridimensionamento ottimale è una procedura iterativa con l'obiettivo di trovare tali distanze sulla scala ordinale - cioè trovare tale trasformazione monotonica di essa - in modo che la lineare tra le variabili sia massimizzata il più possibile. Mentre l'approccio di classificazione si basa sul presupposto "la scala reale corrisponde a dati con distribuzione uniforme", l'approccio di ridimensionamento ottimale si basa sul presupposto "la scala reale corrisponde a dati con lineare massimarrr". Il ridimensionamento ottimale può essere fatto nella regressione categoriale (CATREG). Tuttavia, la regressione categorica richiede che l'altra variabile di input sia discreta (non necessariamente ordinale) e quindi se è continua con molti valori univoci dovrà essere arbitrariamente vincolata da te .
Ci sono anche altri approcci. Ma in ogni caso, trasformiamo monotonicamente la scala ordinale "in modo da ..." (qualche ipotesi o qualche obiettivo), perché la scala ordinale ci è distorta in un modo sconosciuto. Radicalmente un'altra decisione sarebbe quella di "sobriare" prima e decidere che non è distorto (cioè è intervallo), o distorto in un modo noto (è non uniforme), o è nominale.
Alcuni approcci asimmetrici possono includere la regressione ordinale della variabile ordinale dall'altra (intervallo / continua). O regressione lineare di quest'ultima da parte di quella ordinale, con il modello in cui il predittore viene preso come contrasto polinomiale (cioè inserito come b1X + b2X^2 + b3X^3,...
). Il punto debole di questi approcci è che sono asimmetrici: una variabile dipende, l'altra è indipendente.