Qual è la differenza tra una caratteristica e un'etichetta?


101

Sto seguendo un tutorial sulle basi dell'apprendimento automatico e viene detto che qualcosa può essere una funzionalità o un'etichetta .

Per quanto ne so, una funzionalità è una proprietà dei dati che viene utilizzata. Non riesco a capire quale sia l'etichetta, conosco il significato della parola, ma voglio sapere cosa significa nel contesto dell'apprendimento automatico.


Le caratteristiche sono i campi utilizzati come input e le etichette vengono utilizzate come output. Come semplice esempio, si consideri come prevedere se si debba vendere un'auto in base al chilometraggio dell'auto, all'anno, ecc. Sì / no è l'etichetta mentre il chilometraggio e l'anno sarebbero le caratteristiche.
amcneil206

Risposte:


201

In breve, la caratteristica è l'input; l'etichetta viene emessa. Questo vale sia per la classificazione che per i problemi di regressione.

Una caratteristica è una colonna dei dati nel set di input. Ad esempio, se stai cercando di prevedere il tipo di animale domestico che qualcuno sceglierà, le tue caratteristiche di input potrebbero includere età, regione di origine, reddito familiare, ecc. L'etichetta è la scelta finale, come cane, pesce, iguana, roccia, eccetera.

Dopo aver addestrato il tuo modello, gli darai una serie di nuovi input contenenti quelle caratteristiche; restituirà l '"etichetta" (tipo di animale domestico) prevista per quella persona.


1
Quindi [età, regione di origine, reddito familiare] sarebbe "3 vettori di caratteristiche". E in Keras, il tuo array NumPy per la tua rete LSTM sarebbe [campioni, fasi temporali, 3]?
naisanza

1
@naisanza: questa è sicuramente una possibilità. Non conosco Keras, ma questa organizzazione di alto livello potrebbe certamente essere l'inizio di una valida implementazione.
Potatura

caratteristica e variabile sono la stessa cosa?
Debadatta

Vorrei affermare che "etichetta" dipende anche dal contesto; ad esempio, per l'addestramento di un modello, verranno utilizzati dati "etichettati". In questo caso, l'etichetta è la verità fondamentale a cui vengono confrontati i dati di output.
N.Atanasov

Wow. ottima risposta, grazie questo chiarisce molte domande persistenti su questo argomento.
Andrew Ray

31

Caratteristica:

Nella funzionalità di Machine Learning si intende la proprietà dei dati di addestramento. Oppure puoi pronunciare il nome di una colonna nel tuo set di dati di addestramento.

Supponiamo che questo sia il tuo set di dati di addestramento

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

Poi ecco Height, Sexe Agesono le caratteristiche.

etichetta:

L'output che ottieni dal tuo modello dopo l'addestramento è chiamato etichetta.

Supponiamo di aver fornito il set di dati di cui sopra ad un algoritmo e di generare un modello per prevedere il sesso come Maschio o Femmina, Nel modello sopra si passano caratteristiche come age, heightecc.

Quindi, dopo il calcolo, restituirà il sesso come Maschio o Femmina. Si chiama etichetta


5

Ecco un approccio più visivo per spiegare il concetto. Immagina di voler classificare l'animale mostrato in una foto.

Le possibili classi di animali sono ad esempio gatti o uccelli. In tal caso, l' etichetta sarebbe la possibile associazione di classi, ad esempio gatto o uccello, che l'algoritmo di apprendimento automatico prevederà.

Le caratteristiche sono motivi, colori, forme che fanno parte delle tue immagini, ad esempio pelliccia, piume o un'interpretazione più a basso livello, valori dei pixel.

Uccello Etichetta: Bird
Features: Feathers

Gatto

Etichetta: Cat
Caratteristiche: Furr


5

Facciamo un esempio in cui vogliamo rilevare l'alfabeto utilizzando foto scritte a mano. Inseriamo queste immagini di esempio nel programma e il programma classifica queste immagini sulla base delle caratteristiche che hanno.

Un esempio di una caratteristica in questo contesto è: la lettera 'C'può essere pensata come una concava rivolta a destra.

Sorge ora una domanda su come memorizzare queste funzionalità. Dobbiamo nominarli. Ecco il ruolo dell'etichetta che nasce. A tali caratteristiche viene assegnata un'etichetta per distinguerle dalle altre.

Pertanto, otteniamo etichette come output quando vengono fornite funzionalità come input .

Le etichette non sono associate all'apprendimento senza supervisione.


4

Prerequisito: statistiche di base ed esposizione alla ML (regressione lineare)

Si può rispondere con una frase:

Sono uguali ma la loro definizione cambia a seconda delle necessità.

Spiegazione

Lascia che ti spieghi la mia dichiarazione. Supponi di avere un set di dati, a questo scopo considera exercise.csv. Ogni colonna nel set di dati viene chiamata come funzionalità. Sesso, Età, Altezza, Frequenza cardiaca, Body_temp e Calorie potrebbero essere una delle varie colonne. Ogni colonna rappresenta caratteristiche o proprietà distinte.

esercizio.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

Per consolidare la comprensione e chiarire il puzzle, prendiamo due diversi problemi (caso di previsione).

CASO 1: in questo caso potremmo considerare di utilizzare - Sesso, Altezza e Peso per prevedere le calorie bruciate durante l'esercizio. Quella previsione (Y) Calorie qui è un'etichetta . Calorie è la colonna che si desidera prevedere utilizzando varie funzioni come - x1: sesso, x2: altezza e x3: peso .

CASO2: Nel secondo caso qui potremmo voler prevedere Heart_rate utilizzando Gender e Weight come funzionalità. Qui Heart_Rate è un'etichetta prevista utilizzando le funzioni: x1: sesso e x2: peso .

Una volta compresa la spiegazione di cui sopra, non sarai più confuso con l'etichetta e le caratteristiche.


3

Una caratteristica spiegata brevemente sarebbe l'input che hai fornito al sistema e l'etichetta sarebbe l'output che ti aspetti. Ad esempio, hai alimentato molte caratteristiche di un cane come la sua altezza, il colore della pelliccia, ecc., Quindi dopo il calcolo, restituirà la razza del cane che desideri conoscere.


0

Supponi di voler prevedere il clima, quindi le caratteristiche che ti vengono fornite sarebbero i dati storici sul clima, il tempo attuale, la temperatura, la velocità del vento, ecc. E le etichette sarebbero mesi. La combinazione di cui sopra può aiutarti a ricavare previsioni.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.