I dati categorici (detti anche nominali) possono assumere un numero limitato di possibili valori chiamati categorie. I valori categorici "etichetta", non "misurano". Utilizzare il tag [dati ordinali] per tipi di dati discreti ma ordinati.
Sembra che tu possa usare la codifica per una variabile categoriale, ma ho due variabili predittive categoriche e una continua. Posso utilizzare la regressione multipla per questo in SPSS e, in caso affermativo, come? Grazie!
Non sono mai sicuro quando utilizzare la codifica one-hot per variabili categoriali non ordinate e quando non farlo. Lo uso ogni volta che l'algoritmo utilizza una metrica di distanza per calcolare la somiglianza. Qualcuno può dare una regola empirica generale su quali tipi di algoritmi richiederebbero che le caratteristiche categoriche …
Adatto un modello con un fattore con molti livelli e R impiega molto tempo per adattarsi a quel modello. Perchè è questo? Ad esempio, se inserissi una regressione per prevedere gli stipendi dei giocatori e includessi un fattore predittivo per tutte le rispettive nazionalità dei giocatori, ciò richiederebbe un tempo …
Ho già letto tutte le pagine di questo sito cercando di trovare la risposta al mio problema, ma nessuno sembra essere quello giusto per me ... Innanzitutto ti spiego il tipo di dati con cui sto lavorando ... Diciamo che ho un vettore array con diversi nomi di città, uno …
Non so quale funzione di distanza tra individui utilizzare in caso di attributi nominali (non ordinati categorici). Stavo leggendo alcuni libri di testo e suggeriscono la funzione Abbinamento semplice , ma alcuni libri suggeriscono che dovrei cambiare gli attributi nominali in binari e usare Jaccard Coefficient. Tuttavia, cosa succede se …
Problema seguente: desidero prevedere una variabile di risposta categoriale con una (o più) variabili categoriali utilizzando glmnet (). Tuttavia, non riesco a dare un senso all'output che mi dà glmnet. Ok, prima generiamo due variabili categoriche correlate: Genera dati p <- 2 #number variables mu <- rep(0,p) sigma <- matrix(rep(0,p^2), …
È stato realizzato un sondaggio in cui le persone hanno scelto ciò che usano una certa faccina per rappresentare e sono entrati nel loro paese di origine. Ho ricodificato le risposte testuali in numerico. Quale forma di analisi dovrebbe essere usata (preferibilmente in SPSS) per verificare il livello di correlazione …
Ho bisogno di un piccolo aiuto per muovermi nella giusta direzione. È da tanto che non studio tutte le statistiche e il gergo sembra essere cambiato. Immagina di avere una serie di dati relativi all'auto come Durata del viaggio dalla città A alla città B Distanza dalla città A alla …
C'è molto sulla collinearità rispetto ai predittori continui, ma non così tanto che posso trovare su predittori categorici. Ho dati di questo tipo illustrati di seguito. Il primo fattore è una variabile genetica (conta degli alleli), il secondo fattore è una categoria di malattia. Chiaramente i geni precedono la malattia …
Sto eseguendo un modello OLS con una variabile di indice di asset continua come DV. I miei dati sono aggregati da tre comunità simili in stretta vicinanza geografica tra loro. Nonostante ciò, ho pensato che fosse importante usare la community come variabile di controllo. A quanto pare, la comunità è …
Sto cercando correlazioni tra le risposte a diverse domande in un sondaggio ("umm, vediamo se le risposte alla domanda 11 sono correlate a quelle della domanda 78"). Tutte le risposte sono categoriche (la maggior parte di esse va da "molto infelice" a "molto felice"), ma alcune hanno un diverso insieme …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 2 anni fa . Voglio calcolare un riepilogo di una variabile in un data.frame per ogni combinazione unica di fattori nel …
Ho dati incrociati in una tabella 2 x 2 x 6. Chiamiamo le dimensioni response, Ae B. Adatto una regressione logistica ai dati con il modello response ~ A * B. Un'analisi della devianza di quel modello afferma che sia i termini che la loro interazione sono significativi. Tuttavia, osservando …
Il mgcvpacchetto per Rha due funzioni per adattare le interazioni del prodotto tensore: te()e ti(). Comprendo la divisione di base del lavoro tra i due (adattamento di un'interazione non lineare rispetto alla scomposizione di questa interazione in effetti principali e un'interazione). Quello che non capisco è perché te(x1, x2)e ti(x1) …
Sto eseguendo la regressione lineare multipla di seguito in R per prevedere i rendimenti sui fondi gestiti. reg <- lm(formula=RET~GRI+SAT+MBA+AGE+TEN, data=rawdata) Qui solo GRI e MBA sono predittori binari / dicotomici; i predittori rimanenti sono continui. Sto usando questo codice per generare grafici residui per le variabili binarie. plot(rawdata$GRI, reg$residuals) …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.