Ho dei dati per i quali ho calcolato la correlazione di Spearman e voglio visualizzarli per una pubblicazione. La variabile dipendente viene classificata, la variabile indipendente non lo è. Quello che voglio visualizzare è più la tendenza generale che la pendenza effettiva, quindi ho classificato l'indipendente e applicato la correlazione / regressione di Spearman. Ma proprio quando ho tracciato i miei dati e stavo per inserirli nel mio manoscritto, mi sono imbattuto in questa affermazione (su questo sito Web ):
Non userai quasi mai una linea di regressione per la descrizione o la previsione quando esegui la correlazione del rango di Spearman, quindi non calcola l'equivalente di una linea di regressione .
e più tardi
Puoi rappresentare graficamente i dati di correlazione del rango di Spearman come faresti per una regressione o correlazione lineare. Non mettere una linea di regressione sul grafico , tuttavia; sarebbe fuorviante inserire una linea di regressione lineare su un grafico dopo averla analizzata con correlazione di rango.
Il fatto è che le linee di regressione non sono così diverse da quando non classifico l'indipendente e calcolo la correlazione di Pearson. La tendenza è la stessa, ma a causa delle tasse esorbitanti per la grafica a colori nelle riviste sono andato con la rappresentazione monocromatica e i punti dati reali si sovrappongono così tanto che non è riconoscibile.
Potrei ovviare a questo, ovviamente, creando due diversi grafici: uno per i punti dati (classificato) e uno per la linea di regressione (non classificato), ma se si scopre che la fonte che ho citato è sbagliata o il problema non così problematico nel mio caso, mi renderebbe la vita più semplice. (Ho visto anche questa domanda , ma non mi ha aiutato.)
Modifica per ulteriori informazioni:
La variabile indipendente sull'asse x rappresenta il numero di funzioni e la variabile dipendente sull'asse y rappresenta il rango se gli algoritmi di classificazione sono confrontati nelle loro prestazioni. Ora ho alcuni algoritmi che sono comparabili in media, ma quello che voglio dire con la mia trama è qualcosa del tipo: "Mentre il classificatore A migliora, più sono presenti le funzionalità, il classificatore B è migliore quando sono presenti meno funzionalità"
Modifica 2 per includere i miei grafici:
Ranghi degli algoritmi tracciati rispetto al numero di funzioni
Classifiche degli algoritmi tracciati rispetto al numero classificato di funzionalità
Quindi, per ripetere la domanda dal titolo:
Va bene tracciare una linea di regressione per i dati classificati di una correlazione / regressione di Spearman?