Quindi ho giocato con gli SVM e mi chiedo se questa è una buona cosa da fare:
Ho un set di funzionalità continue (da 0 a 1) e un set di funzionalità categoriche che ho convertito in variabili fittizie. In questo caso particolare, codifico la data della misurazione in una variabile fittizia:
Ci sono 3 periodi da cui ho i dati e ho prenotato 3 numeri di funzione per loro:
20: 21: 22:
Quindi, a seconda del periodo da cui provengono i dati, a diverse funzioni verrà assegnato 1; gli altri avranno 0.
SVM funzionerà correttamente con questa o questa è una brutta cosa da fare?
Uso SVMLight e un kernel lineare.