Sono alle prime armi con l'apprendimento automatico e le macchine fotografiche e ora sto lavorando a un problema di classificazione delle immagini multi-classe usando le macchine fotografiche. L'input è immagine taggata. Dopo alcune preelaborazioni, i dati di allenamento sono rappresentati nell'elenco Python come:
[["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]]
"cane", "gatto" e "uccello" sono le etichette di classe. Penso che la codifica one-hot debba essere utilizzata per questo problema, ma non sono molto chiaro su come gestirlo con queste etichette di stringa. Ho provato LabelEncoder () di sklearn in questo modo:
encoder = LabelEncoder()
trafomed_label = encoder.fit_transform(["dog", "cat", "bird"])
print(trafomed_label)
E l'output è [2 1 0], che è diverso dall'output delle mie aspettative di qualcosa come [[1,0,0], [0,1,0], [0,0,1]]. Può essere fatto con un po 'di codice, ma mi piacerebbe sapere se esiste un modo "standard" o "tradizionale" per gestirlo?