Ho creato modelli con dati categorici per un po 'di tempo e quando in questa situazione fondamentalmente non utilizzo la funzione LabelEncoder di scikit-learn per trasformare questi dati prima di creare un modello.
Capisco la differenza tra OHE
, LabelEncoder
e DictVectorizor
in termini di ciò che stanno facendo per i dati, ma ciò che non è chiaro per me è quando si potrebbe scegliere di impiegare una tecnica piuttosto che un'altra.
Esistono determinati algoritmi o situazioni in cui si hanno vantaggi / svantaggi rispetto agli altri?