Ho un set di dati che contiene sia variabili categoriali che variabili continue. Mi è stato consigliato di trasformare le variabili categoriali in variabili binarie per ogni livello (ad esempio, A_level1: {0,1}, A_level2: {0,1}) - Penso che alcuni abbiano chiamato queste "variabili fittizie".
Detto questo, sarebbe fuorviante quindi centrare e ridimensionare l'intero set di dati con le nuove variabili? Sembra che perderei il significato "on / off" delle variabili.
Se è fuorviante, significa che dovrei centrare e ridimensionare le variabili continue separatamente e quindi aggiungerle nuovamente al mio set di dati?
TIA.