I dati categorici (detti anche nominali) possono assumere un numero limitato di possibili valori chiamati categorie. I valori categorici "etichetta", non "misurano". Utilizzare il tag [dati ordinali] per tipi di dati discreti ma ordinati.
Ho problemi a interpretare i valori z per le variabili categoriali nella regressione logistica. Nell'esempio che segue ho una variabile categoriale con 3 classi e in base al valore z, CLASS2 potrebbe essere rilevante mentre le altre no. Ma ora cosa significa? Che potrei unire le altre classi in una? …
Per utilizzare SVM o la rete neurale è necessario trasformare (codificare) le variabili categoriali in variabili numeriche, il metodo normale in questo caso è utilizzare 0-1 valori binari con il k-esimo valore categoriale trasformato in (0,0, .. ., 1,0, ... 0) (1 è sulla posizione k-esima). Esistono altri metodi per …
Quando si tenta di spiegare le analisi dei cluster, è comune che le persone fraintendano il processo come correlato alla correlazione delle variabili. Un modo per superare la confusione è una trama come questa: Questo mostra chiaramente la differenza tra la domanda se ci sono cluster e la questione se …
Comprendo il concetto che è la media per quando la variabile categoriale è uguale a 0 (o è il gruppo di riferimento), dando l'interpretazione finale che il coefficiente di regressione è la differenza nella media delle due categorie. Anche con> 2 categorie suppongo che ogni spieghi la differenza tra la …
Ho trovato una seguente spiegazione su un blog e vorrei ottenere maggiori informazioni sulla non transitività della correlazione: Abbiamo i seguenti fatti indiscutibili: In media, c'è una differenza nel volume del cervello tra uomini e donne Esiste una correlazione tra QI e dimensioni del cervello; la correlazione è 0,33 e …
Ho uno spazio di 35 dimensioni (attributi). Il mio problema analitico è una semplice classificazione. Di 35 dimensioni, oltre 25 sono categoriche e ogni attributo accetta più di 50+ tipi di valori. In quello scenario, anche l'introduzione di una variabile fittizia non funzionerà per me. Come posso eseguire un SVM …
Solo per chiarire, quando intendo le statistiche riassuntive, mi riferisco agli intervalli medi, quartili mediani, varianza, deviazione standard. Quando si riassume un univariato che è categorico o qualitativo , considerando sia i casi nominali che quelli ordinali , ha senso trovare la sua media, mediana, intervalli di quartile, varianza e …
tl; dr Qual è il modo consigliato di trattare i discretedati quando si esegue il rilevamento di anomalie? Qual è il modo consigliato di trattare i categoricaldati quando si esegue il rilevamento di anomalie? Questa risposta suggerisce l'utilizzo di dati discreti per filtrare i risultati. Sostituisci forse il valore della …
Se in una regressione lineare ho una variabile categoriale ... come faccio a sapere il significato stastico della variabile categoriale? Supponiamo che il fattore abbia 10 livelli ... ci saranno 10 diversi valori t risultanti, sotto l'ombrello di una variabile fattore ...X 1X1X1X_1X1X1X_1 Mi sembra che la significatività statistica sia …
Devo classificare gli URL in categorie. Supponiamo di avere 15 categorie a cui sto pianificando di azzerare ogni URL. Un classificatore a 15 vie è migliore? Dove ho 15 etichette e generare funzionalità per ciascun punto dati. O costruendo 15 classificatori binari, dì: Film o Non film, e usa i …
Sto eseguendo un LASSO che ha alcuni predittori di variabili categorici e alcuni continui. Ho una domanda sulle variabili categoriche. Il primo passo che capisco è quello di dividere ciascuno di loro in manichini, standardizzarli per una giusta penalizzazione e quindi regredire. Diverse opzioni sorgono per il trattamento delle variabili …
Ho una variabile indipendente chiamata "qualità"; questa variabile ha 3 modalità di risposta (cattiva qualità; media qualità; alta qualità). Voglio introdurre questa variabile indipendente nella mia regressione lineare multipla. Quando ho una variabile binaria indipendente (variabile fittizia, posso codificare 0/ 1) è facile introdurla in un modello di regressione lineare …
Una volta mi sono imbattuto in un tipo di trama per dati categorici (ad esempio, tabelle di contingenza) su Internet, che mi è davvero piaciuto, ma non l'ho mai trovato di nuovo, e non so nemmeno come si chiama. Era essenzialmente come una trama del setaccio, in quanto le altezze …
Sto cercando di capire come posso ottenere l'importanza di una variabile categoriale che è stata suddivisa in variabili fittizie. Sto usando scikit-learn che non gestisce le variabili categoriali per te come fanno R o h2o. Se suddivido una variabile categoriale in variabili fittizie, ottengo importazioni di funzionalità separate per classe …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.