Ho imparato che, per creare un modello di regressione, dobbiamo occuparci delle variabili categoriali convertendole in variabili fittizie. Ad esempio, se, nel nostro set di dati, esiste una variabile come posizione:
Location
----------
Californian
NY
Florida
Dobbiamo convertirli come:
1 0 0
0 1 0
0 0 1
Tuttavia, è stato suggerito di scartare una variabile fittizia, indipendentemente dal numero di variabili fittizie presenti.
Perché dobbiamo scartare una variabile fittizia?