Trasformo tutti i miei dati o le mie pieghe (se viene applicato il CV) contemporaneamente? per esempio
(allData - mean(allData)) / sd(allData)
Trasformo il set di treni e il set di test separatamente? per esempio
(trainData - mean(trainData)) / sd(trainData)
(testData - mean(testData)) / sd(testData)
Oppure trasformo il set di treni e utilizzo i calcoli sul set di test? per esempio
(trainData - mean(trainData)) / sd(trainData)
(testData - mean(trainData)) / sd(trainData)
Credo che 3 sia la strada giusta. Se 3 è corretto, devo preoccuparmi che la media non sia 0 o che l'intervallo non sia compreso tra [0; 1] o [-1; 1] (normalizzazione) del testset?
R
? Vedere questa domanda: stackoverflow.com/questions/49260862/...