Domande taggate «data-transformation»

Re-espressione matematica, spesso non lineare, di valori di dati. I dati vengono spesso trasformati per soddisfare le ipotesi di un modello statistico o per rendere più interpretabili i risultati di un'analisi.



5
Riduzione della dimensionalità SVD per serie storiche di diversa lunghezza
Sto usando la decomposizione del valore singolare come tecnica di riduzione della dimensionalità. Dati i Nvettori di dimensione D, l'idea è quella di rappresentare le caratteristiche in uno spazio trasformato di dimensioni non correlate, che condensa la maggior parte delle informazioni dei dati negli autovettori di questo spazio in ordine …



1
Si consigliano trasformazioni di root?
Il mio collega vuole analizzare alcuni dati dopo aver trasformato la variabile di risposta elevandola alla potenza di (ovvero ).1818\frac18y0.125y0.125y^{0.125} Non mi sento a mio agio con questo, ma faccio fatica a capire perché. Non riesco a pensare a nessuna logica meccanicistica per questa trasformazione. Né l'ho mai visto prima, …



2
Normalmente X e Y distribuiti hanno maggiori probabilità di provocare residui normalmente distribuiti?
Qui viene discussa l'interpretazione errata dell'assunzione della normalità nella regressione lineare (che la "normalità" si riferisce alla X e / o Y anziché ai residui) e il poster chiede se è possibile avere X e Y non distribuiti normalmente e hanno ancora residui normalmente distribuiti. La mia domanda è: normalmente …


1
Criteri per la selezione del modello "migliore" in un modello Markov nascosto
Ho un set di dati di serie temporali in cui sto cercando di adattare un modello Hov (Hidden Markov Model) al fine di stimare il numero di stati latenti nei dati. Il mio pseudo codice per farlo è il seguente: for( i in 2 : max_number_of_states ){ ... calculate HMM …


1
Perché usare le variabili registrate?
Probabilmente, questa è una domanda molto semplice, ma non riesco a trovare una risposta solida per questo. Spero qui, posso. Attualmente sto leggendo articoli come preparazione per la mia tesi di master. Attualmente sto leggendo un documento che ricerca il rapporto tra tweet e caratteristiche del mercato azionario. In una …

2
Cosa fare quando alcuni punti temporali hanno risposte fortemente distorte e altri no in uno studio di misure ripetute?
Tipicamente, quando si incontrano misure di risultato continue ma distorte in un disegno longitudinale (diciamo, con un effetto tra soggetti) l'approccio comune è quello di trasformare il risultato in normalità. Se la situazione è estrema, come nel caso delle osservazioni troncate, si potrebbe essere fantasiosi e utilizzare un modello di …

2
I modelli di serie temporali con differenza di registro sono migliori dei tassi di crescita?
Spesso vedo gli autori stimare un modello di "differenza log", ad es log( yt) - registro( yt - 1) = log( yt/ yt - 1) = α + βXtlog⁡(yt)-log⁡(yt-1)=log⁡(yt/yt-1)=α+βXt\log (y_t)-\log(y_{t-1}) = \log(y_t/y_{t-1}) = \alpha + \beta x_t Sono d'accordo che questo sia appropriato per relazione con una variazione percentuale in …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.