Recentemente ho imparato che uno dei modi per trovare soluzioni migliori per i problemi di ML è attraverso la creazione di funzionalità. Si può fare per esempio sommando due funzionalità.
Ad esempio, possediamo due caratteristiche: "attacco" e "difesa" di un qualche tipo di eroe. Creiamo quindi funzionalità aggiuntive chiamate "totale" che è una somma di "attacco" e "difesa". Ora, ciò che mi sembra strano è che anche un duro "attacco" e "difesa" sono quasi perfettamente correlati con il "totale", ma otteniamo comunque informazioni utili.
Qual è la matematica dietro questo? O ho sbagliato a ragionare?
Inoltre, non è un problema, per i classificatori come kNN, che "totale" sarà sempre più grande di "attacco" o "difesa"? Quindi, anche dopo la standardizzazione avremo caratteristiche che contengono valori di intervalli diversi?