Comprendo il concetto di ridimensionamento della matrice di dati da utilizzare in un modello di regressione lineare. Ad esempio, in R potresti usare:
scaled.data <- scale(data, scale=TRUE)
La mia unica domanda è, per le nuove osservazioni per le quali voglio prevedere i valori di output, come vengono ridimensionati correttamente? Sarebbe scaled.new <- (new - mean(data)) / std(data)
?
y = y_esc * sd(y) + mean(y)
, ma immagino che farebbe confusione con le proprietà del modello, quindi aspetto anche una risposta più tecnica!