Di recente ho appreso sull'uso del trucco del kernel, che mappa i dati in spazi di dimensioni superiori nel tentativo di linearizzare i dati in quelle dimensioni. Ci sono casi in cui dovrei evitare di usare questa tecnica? È solo una questione di trovare la giusta funzione del kernel?
Per i dati lineari questo ovviamente non è utile, ma per i dati non lineari, questo sembra sempre utile. L'uso di classificatori lineari è molto più semplice di non lineare in termini di tempo di allenamento e scalabilità.