Domande taggate «categorical-encoding»

Rappresentazione di variabili categoriali come insiemi di variabili numeriche. Necessari in molti tipi di analisi per elaborare dati categorici. Un esempio comune è l'utilizzo di un predittore categorico in regressione / ANOVA tramite codifica fittizia, codifica effetto, codifica Helmert, contrasti definiti dall'utente, ecc.




1
Eliminazione di una delle colonne quando si utilizza la codifica a caldo
La mia comprensione è che nell'apprendimento automatico può essere un problema se il tuo set di dati ha caratteristiche altamente correlate, poiché codificano effettivamente le stesse informazioni. Recentemente qualcuno ha sottolineato che quando si esegue la codifica one-hot su una variabile categoriale si finisce con funzionalità correlate, quindi è necessario …

3
Quando si dovrebbe usare la regressione multipla con codifica fittizia rispetto a ANCOVA?
Di recente ho analizzato un esperimento che ha manipolato 2 variabili categoriche e una variabile continua usando ANCOVA. Tuttavia, un revisore ha suggerito che la regressione multipla con la variabile categoriale codificata come variabili fittizie è un test più appropriato per esperimenti con variabili sia categoriche sia continue. Quando è …


5
Come ricodificare la variabile categoriale in variabile numerica quando si utilizza SVM o Neural Network
Per utilizzare SVM o la rete neurale è necessario trasformare (codificare) le variabili categoriali in variabili numeriche, il metodo normale in questo caso è utilizzare 0-1 valori binari con il k-esimo valore categoriale trasformato in (0,0, .. ., 1,0, ... 0) (1 è sulla posizione k-esima). Esistono altri metodi per …


2
La codifica variabile qualitativa nella regressione porta a "singolarità"
Ho una variabile indipendente chiamata "qualità"; questa variabile ha 3 modalità di risposta (cattiva qualità; media qualità; alta qualità). Voglio introdurre questa variabile indipendente nella mia regressione lineare multipla. Quando ho una variabile binaria indipendente (variabile fittizia, posso codificare 0/ 1) è facile introdurla in un modello di regressione lineare …

2
“Variabile fittizia” rispetto a “variabile indicatore” per dati nominali / categorici
"Variabile fittizia" e "variabile indicatore" sono termini usati frequentemente per indicare l'appartenenza a una categoria con codifica 0/1; di solito 0: non un membro della categoria, 1: membro della categoria. Il 26/11/2014 una rapida ricerca su scholar.google.com (con virgolette allegate) rivela che "variabile fittizia" viene utilizzata in circa 318.000 articoli …


1
Quali sono i diversi tipi di codifiche disponibili per le variabili categoriali (in R) e quando le useresti?
Se si adatta un modello lineare o un modello misto, sono disponibili diversi tipi di codifica per trasformare una varibale categorica o nominale in un numero di variabili per le quali vengono stimati i parametri, come il conding fittizio (impostazione predefinita R) e la codifica degli effetti. Ho sentito che …




Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.