Re-espressione matematica, spesso non lineare, di valori di dati. I dati vengono spesso trasformati per soddisfare le ipotesi di un modello statistico o per rendere più interpretabili i risultati di un'analisi.
Puoi avere dati in formato largo o lungo. Questa è una cosa abbastanza importante, poiché i metodi utilizzabili sono diversi, a seconda del formato. So che devi lavorare con melt()e cast()dal pacchetto reshape, ma sembra che alcune cose non capisco. Qualcuno può darmi una breve panoramica di come si fa?
Supponiamo ad esempio che stai realizzando un modello lineare, ma i dati sono complessi.yyy y= x β+ ϵy=xβ+ϵ y = x \beta + \epsilon Il mio set di dati è complesso, come in tutti i numeri in yyy sono della forma ( a + b i )(a+bi)(a + bi) . …
Sto lavorando con un set di dati di grandi dimensioni (riservato, quindi non posso condividere troppo) e sono giunto alla conclusione che sarebbe necessaria una regressione binomiale negativa. Non ho mai fatto una regressione glm prima e non riesco a trovare informazioni chiare su quali siano le ipotesi. Sono gli …
Una fase di pre-elaborazione comune per gli algoritmi di apprendimento automatico è lo sbiancamento dei dati. Sembra che sia sempre bene fare lo sbiancamento poiché de-mette in correlazione i dati, rendendolo più semplice da modellare. Quando lo sbiancamento non è raccomandato? Nota: mi riferisco alla de-correlazione dei dati.
Sto cercando di eseguire una regressione multipla in R. Tuttavia, la mia variabile dipendente ha il seguente diagramma: Ecco una matrice scatterplot con tutte le mie variabili ( WARè la variabile dipendente): So che devo eseguire una trasformazione su questa variabile (e forse sulle variabili indipendenti?) Ma non sono sicuro …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 6 anni fa . Vorrei eseguire la normalizzazione a livello di colonna di una matrice in R. Data una matrice m, …
In precedenza ho usato la previsione pro per prevedere serie temporali univariate, ma sto passando il mio flusso di lavoro a R. Il pacchetto di previsione per R contiene molte funzioni utili, ma una cosa che non fa è qualsiasi tipo di trasformazione dei dati prima di eseguire auto .arima …
La mia variabile dipendente mostrata di seguito non si adatta a nessuna distribuzione di titoli che io conosca. La regressione lineare produce residui in qualche modo non normali, inclinati a destra che si riferiscono alla Y prevista in modo strano (2 ° diagramma). Qualche suggerimento per trasformazioni o altri modi …
Comprendo la logica della codifica per l'analisi dei dati. La mia domanda che segue è sull'uso di un codice specifico. C'è un motivo per cui il genere è spesso codificato come 0 per la femmina e 1 per il maschio? Perché questa codifica è considerata "standard"? Confronta questo con Female …
L'apprendimento automatico (ML) utilizza fortemente le tecniche di regressione lineare e logistica. Essa si basa anche su tecniche di ingegneria funzione ( feature transform, kernel, ecc). Perché non si parla di variable transformation(ad esempio power transformation) in ML? (Ad esempio, non ho mai sentito parlare di root o log su …
Sto cercando un case study di regressione lineare avanzato che illustri i passaggi necessari per modellare relazioni complesse e multiple non lineari utilizzando GLM o OLS. È sorprendentemente difficile trovare risorse che vadano oltre gli esempi scolastici di base: la maggior parte dei libri che ho letto non andrà oltre …
Sto lavorando a un algoritmo che si basa sul fatto che le osservazioni sono normalmente distribuite e vorrei testare empiricamente la solidità dell'algoritmo a questa ipotesi.YYY Per fare questo, ero alla ricerca di una sequenza di trasformazioni che avrebbe progressivamente interrompere la normalità di . Ad esempio se gli sono …
Sto usando la quarta 1/4trasformazione di potenza root ( ) sulla mia variabile di risposta, a causa dell'eteroscedasticità. Ma ora non sono sicuro di come interpretare i miei coefficienti di regressione. Presumo che avrei bisogno di portare i coefficienti alla quarta potenza quando mi trasformo indietro (vedi sotto l'output di …
Ho costruito un indice di capitale sociale usando la tecnica PCA. Questo indice comprende valori sia positivi che negativi. Voglio trasformare / convertire questo indice in scala 0-100 per facilitarne l'interpretazione. Per favore, suggeriscimi un modo più semplice per farlo.
Esiste un'alternativa (più forte?) Alla trasformazione della radice quadrata di arcsin per dati percentuale / proporzionali? Nel set di dati su cui sto lavorando al momento, rimane marcata eteroscedasticità dopo che ho applicato questa trasformazione, vale a dire che la trama dei residui rispetto ai valori adattati è ancora molto …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.