Ho tre funzionalità che utilizzo per risolvere un problema di classificazione. Inizialmente, queste caratteristiche producevano valori booleani, quindi ho potuto valutare la loro ridondanza osservando quanto si sovrappongono gli insiemi di classificazioni positive e negative. Ora ho invece esteso le funzionalità per produrre valori reali (punteggi), e vorrei analizzarne nuovamente la ridondanza, ma sono completamente a corto di come farlo. Qualcuno può fornirmi un puntatore o un'idea su come procedere?
So che questa domanda è molto vaga, cioè perché non ho una conoscenza molto forte delle statistiche. Quindi, se non hai una risposta per me, forse hai alcune domande che possono aiutarmi a capire meglio me stesso.
Modifica: Attualmente sto navigando su Wikipedia sull'argomento, ho la sensazione che quello che voglio sia un coefficiente di correlazione, ma non sono ancora sicuro se questo sia l'approccio giusto e quale dei molti coefficienti disponibili sia appropriato.
Modifica 2: Nel caso booleano, ho prima creato per ogni funzione il set di campioni per cui era vero. Quindi, la correlazione tra due caratteristiche era la dimensione dell'intersezione di questi insiemi rispetto alla dimensione dell'unione di questi insiemi. Se questo valore è 1, sono completamente ridondanti, perché sempre gli stessi. Se è 0, non sono mai gli stessi.