I dati categorici (detti anche nominali) possono assumere un numero limitato di possibili valori chiamati categorie. I valori categorici "etichetta", non "misurano". Utilizzare il tag [dati ordinali] per tipi di dati discreti ma ordinati.
Ho un set di dati che contiene sia dati continui che categorici. Sto analizzando usando PCA e mi chiedo se sia giusto includere le variabili categoriali come parte dell'analisi. La mia comprensione è che PCA può essere applicato solo a variabili continue. È corretto? Se non può essere utilizzato per …
Ho un dataframe con molte osservazioni e molte variabili. Alcuni sono categorici (non ordinati) e altri sono numerici. Sto cercando associazioni tra queste variabili. Sono stato in grado di calcolare la correlazione per variabili numeriche (correlazione di Spearman) ma: Non so come misurare la correlazione tra variabili categoriche non ordinate. …
Sto iniziando a dilettarsi con l'uso di glmnetcon LASSO Regressione dove il mio risultato di interesse è dicotomica. Di seguito ho creato un piccolo frame di dati finti: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) …
Ho una variabile nominale (diversi argomenti di conversazione, codificata come topic0 = 0 ecc.) E un numero di variabili di scala (DV) come la durata di una conversazione. Come posso derivare correlazioni tra le variabili nominali e di scala?
Quali tecniche sono disponibili per il collasso (o il raggruppamento) di molte categorie a poche, allo scopo di usarle come input (predittore) in un modello statistico? Considera una variabile come quella di uno studente universitario (disciplina scelta da uno studente universitario). Non è ordinato e categorico, ma può potenzialmente avere …
Nel rispondere a questa domanda su dati discreti e continui ho asserito con disinvoltura che raramente ha senso trattare i dati categorici come continui. A prima vista sembra evidente, ma l'intuizione è spesso una cattiva guida per le statistiche, o almeno lo è la mia. Quindi ora mi chiedo: è …
Esistono due modi diversi per codificare le variabili categoriali. Supponiamo che una variabile categoriale abbia n valori. La codifica one-hot lo converte in n variabili, mentre la codifica fittizia lo converte in n-1 variabili. Se abbiamo k variabili categoriali, ognuna delle quali ha n valori. Una codifica a caldo termina …
Qual è un grafico appropriato per illustrare la relazione tra due variabili ordinali? Alcune opzioni che mi vengono in mente: Grafico a dispersione con jitter casuale aggiunto per fermare i punti che si nascondono l'un l'altro. Apparentemente un grafico standard - Minitab lo definisce un "diagramma di valori individuali". Secondo …
Che cosa è esattamente la matrice di contrasto (un termine, pertinente ad un'analisi con predittori categorici) e come viene specificata esattamente la matrice di contrasto? Cioè cosa sono le colonne, quali sono le righe, quali sono i vincoli su quella matrice e cosa significano i numeri nelle colonne je nelle …
Vorrei trovare la correlazione tra una variabile continua (variabile dipendente) e una categorica (nominale: genere, variabile indipendente). I dati continui non vengono normalmente distribuiti. Prima l'avevo calcolato usando Spearman's . Tuttavia, mi è stato detto che non è giusto.ρρ\rho Durante la ricerca su Internet, ho scoperto che il boxplot può …
Ho dei dati che mostrano i risultati degli esami di ammissione dei vigili del fuoco. Sto testando l'ipotesi che i risultati degli esami e l'etnia non si escludano a vicenda. Per provare questo, ho eseguito un test chi-quadrato di Pearson in R. I risultati mostrano ciò che mi aspettavo, ma …
Sto lavorando a un set di dati con oltre 200.000 campioni e circa 50 funzioni per campione: 10 variabili continue e le altre ~ 40 sono variabili categoriali (paesi, lingue, campi scientifici ecc.). Per queste variabili categoriche, hai ad esempio 150 paesi diversi, 50 lingue, 50 campi scientifici ecc ... …
Diciamo che abbiamo una variabile dipendente con poche categorie e un insieme di variabili indipendenti. YYY Quali sono i vantaggi della regressione logistica multinomiale rispetto a un insieme di regressioni logistiche binarie (ovvero schema one-vs-rest )? Per set di regressione logistica binaria intendo che per ogni categoria costruiamo un modello …
Carissimi, ho notato qualcosa di strano che non posso spiegare, vero? In sintesi: l'approccio manuale al calcolo di un intervallo di confidenza in un modello di regressione logistica e la funzione R confint()danno risultati diversi. Ho attraversato la regressione logistica applicata di Hosmer & Lemeshow (2a edizione). Nel terzo capitolo …
Ho un set di dati con un gran numero di risposte Sì / No. Posso utilizzare i componenti principali (PCA) o altre analisi di riduzione dei dati (come l'analisi dei fattori) per questo tipo di dati? Si prega di avvisare come faccio a fare questo usando SPSS.
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.