Qual è il nome dell'operatore che prende un vettore categorico e lo trasforma in rappresentazione binaria usando la codifica a caldo? Mi chiedo da quando scrivo un articolo scientifico e ho bisogno di un nome proprio per questo.
Qual è il nome dell'operatore che prende un vettore categorico e lo trasforma in rappresentazione binaria usando la codifica a caldo? Mi chiedo da quando scrivo un articolo scientifico e ho bisogno di un nome proprio per questo.
Risposte:
Gli statistici chiamano la codifica one-hot come codifica fittizia . Come altri hanno suggerito (incluso Scortchi nei commenti), questo non è un sinonimo esatto, ma questo è il termine che verrebbe normalmente usato per le variabili categoriali codificate 0-1.
Vedi anche: "Variabile fittizia" rispetto a "variabile indicatore" per dati nominali / categorici
Dipende dal tuo pubblico di destinazione.
Come ha detto Tim , gli statistici lo chiamano codifica fittizia, ed è quello che mi aspetterei di vedere descrivendo qualcosa come un modello di regressione. "Sono state incluse variabili fittizie codificate per adattarsi alla posizione del negozio." Penso che chiamarlo una codifica one-hot sembrerebbe leggermente strano qui.
Tuttavia, come ha detto anche un altro Tim , la codifica a caldo è abbastanza comune nella letteratura dell'apprendimento automatico. Implica debolmente l'esistenza di nodi (come in una rete neurale), fili fisici (in un dispositivo) o qualcosa del genere, almeno per me.
Formalmente, suppongo che tu stia applicando una serie di funzioni indicatore , ma probabilmente è troppo formale al di fuori di una prova.
Il termine deriva dall'ingegneria elettronica. Pensi solo chi chiamerebbe 1 "caldo"? Solo quelli che lavorano con l'elettricità, dove "caldo" o "vivo" significa che c'è un potenziale elettrico sul filo . "One hot" si riferisce al design del circuito in cui il livello del segnale elettrico discreto su un filo verrebbe decodificato in caldo / freddo su un set di fili. Suppongo che alcune persone di machine learning con background EE abbiano trovato convincente l'analogia.
In econometria e statistica potresti incontrare dummy
o indicator
variabili, che sono abbastanza simili perché sono usate per rappresentare categorie distinte con i loro indicatori distinti. C'è una sottile differenza però. Ad esempio, crei dei manichini K-1 per le categorie K, perché la categoria di base corrisponde a tutti i manichini impostati su 0. Al contrario, penso che in una codifica a caldo tu abbia fili K, dove la categoria di base avrà il suo filo ( variabile).
Sono stato istruito statisticamente e recentemente ho sentito parlare di "codifica one-hot" in machine learning / scienze comp. Di solito ho appena fatto riferimento alla matrice a un solo punto come a matrice di progettazione / matrice di dati / cornice di progettazione.
Nelle scienze fisiche e ingegneria, si chiama il delta di Kronecker (generalizzato) .
Nella forma più semplice, il delta di Kroneker è definito come anche se questo è banalmente generalizzato a
Pertanto, " " tenderà a essere letto come che la maggior parte gli autori tenderanno a troncare a " ", se la categoria è ovvia dal contesto.
Il delta di Kronecker è davvero utile in Sigma / Pi / Einstein / ecc. notazioni poiché consente di specificare i termini in modo condizionale.
Giusto per collegare questo a strutture di programmazione comuni, il delta di Kronecker condition?1:0
, dove ?:
è l' operatore condizionale .
Come nota tangenziale, incoraggerei gli autori ad abbandonare il vecchio stile a favore dell'equivalente generalizzato, . La notazione vecchio stile non ha alcun vantaggio, mentre la notazione generalizzata è più esplicita ed estensibile.
Pattern Recognition and Machine Learning di Christopher Bishop utilizza il termine -of- schema.K
Ecco una citazione dal libro,
Le variabili binarie possono essere utilizzate per descrivere quantità che possono assumere uno dei due valori possibili. Spesso, tuttavia, incontriamo variabili discrete che possono assumere uno dei possibili stati reciprocamente esclusivi. Sebbene ci siano vari modi alternativi per esprimere tali variabili, vedremo tra poco che una rappresentazione particolarmente conveniente è lo schema -of- in cui la variabile è rappresentata da un vettore tridimensionale in cui uno dei gli elementi equivalgono a e tutti gli elementi rimanenti sono uguali a . Quindi, per esempio, se abbiamo una variabile che può prendere1 K K x x k 1 0 K = 6 x 3 = 1 xstati e una particolare osservazione della variabile corrisponde allo stato in cui , quindi sarà rappresentato da,