Misurazione della correlazione di reti neurali addestrate


9

Sto addestrando una rete neurale artificiale (backpropagation, feed-forward) con dati distribuiti non normali. Oltre all'errore quadratico medio della radice, la letteratura suggerisce spesso il coefficiente di correlazione di Pearson per valutare la qualità della rete addestrata. Ma il coefficiente di correlazione di Pearson è ragionevole se i dati di allenamento non sono normalmente distribuiti? Non sarebbe più ragionevole utilizzare una misura di correlazione basata sul rango, ad esempio Spearman rho?


Puoi approfondire come si userebbe esattamente o dare un riferimento?
Bayerj,

Risposte:


6

Il coefficiente di correlazione di Pearson misura l'associazione lineare. Essendo basato su secondi momenti centrali empirici, è influenzato da valori estremi. Perciò:

  • La prova della non linearità in un diagramma a dispersione dei valori effettivi rispetto a quelli previsti suggerirebbe di utilizzare un'alternativa come il coefficiente di correlazione dei ranghi (Spearman);

    • Se la relazione appare in media monotona (come nella riga superiore dell'illustrazione), sarà efficace un coefficiente di correlazione del rango;

    • Altrimenti, la relazione è curvilinea (come in alcuni esempi della riga inferiore dell'illustrazione, come quella più a sinistra o quella a forma di U centrale) e probabilmente qualsiasi misura di correlazione sarà una descrizione inadeguata; l'uso di un coefficiente di correlazione rango non risolverà questo problema.

  • La presenza di dati periferici nel grafico a dispersione indica che il coefficiente di correlazione di Pearson potrebbe sovrastimare la forza della relazione lineare. Potrebbe essere o non essere corretto; usalo con la dovuta cautela. Il coefficiente di correlazione dei ranghi potrebbe essere o non essere migliore, a seconda di quanto siano affidabili i valori periferici.

Esempi di grafici a dispersione e relative correlazioni di Pearson

(Immagine copiata dall'articolo di Wikipedia sul coefficiente di correlazione momento-prodotto di Pearson .)


Puoi fornire alcune fonti per la tua affermazione sull'uso della correlazione di rango per misurare le prestazioni di regressione?
Simon Kuang
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.