Di solito si riferisce alla "standardizzazione z" che sta spostando e riscalando i dati per assicurare che abbiano una varianza media e unitaria nulla. Sono possibili anche altre "standardizzazioni".
In alcune pubblicazioni, ho letto che una regressione con più variabili esplicative, se in unità diverse, doveva essere standardizzata. (La standardizzazione consiste nel sottrarre la media e dividere per la deviazione standard.) In quali altri casi devo standardizzare i miei dati? Ci sono casi in cui dovrei solo centrare i …
Al lavoro ne discutevamo perché il mio capo non ha mai sentito parlare di normalizzazione. Nell'algebra lineare, la normalizzazione sembra riferirsi alla divisione di un vettore per la sua lunghezza. E nelle statistiche, la standardizzazione sembra riferirsi alla sottrazione di una media che poi si divide per la sua SD. …
In quali circostanze vorresti o non vuoi ridimensionare o standardizzare una variabile prima del fitting del modello? E quali sono i vantaggi / gli svantaggi del ridimensionamento di una variabile?
Una buona pratica comune in Machine Learning è quella di caratterizzare la normalizzazione o la standardizzazione dei dati delle variabili del predittore, tutto qui, centrare i dati sottraendo la media e normalizzarli dividendoli per la varianza (o anche la deviazione standard). Per l'autocontenimento e per la mia comprensione facciamo questo …
Trasformo tutti i miei dati o le mie pieghe (se viene applicato il CV) contemporaneamente? per esempio (allData - mean(allData)) / sd(allData) Trasformo il set di treni e il set di test separatamente? per esempio (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Oppure trasformo il set di …
La mia domanda è: dobbiamo standardizzare il set di dati per assicurarci che tutte le variabili abbiano la stessa scala, tra [0,1], prima di adattare la regressione logistica. La formula è: Xio- min ( xio)max ( xio) - min ( xio)Xio-min(Xio)max(Xio)-min(Xio)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} Il mio set di dati ha 2 variabili, descrivono …
Ho 2 semplici domande sulla regressione lineare: Quando si consiglia di standardizzare le variabili esplicative? Una volta effettuata la stima con valori standardizzati, come si può prevedere con nuovi valori (come si dovrebbero standardizzare i nuovi valori)? Alcuni riferimenti sarebbero utili.
Per LASSO (e altre procedure di selezione dei modelli) è fondamentale ridimensionare i predittori. La raccomandazione generale che seguo è semplicemente quella di utilizzare una media di 0, 1 normalizzazione di deviazione standard per variabili continue. Ma cosa c'è da fare con i manichini? Ad esempio alcuni esempi applicati della …
Ho letto tre motivi principali per standardizzare le variabili prima di qualcosa come la Lassoregressione: 1) Interpretazione dei coefficienti. 2) Capacità di classificare l'importanza del coefficiente in base all'entità relativa delle stime del coefficiente post-restringimento. 3) Non è necessario intercettare. Ma mi chiedo il punto più importante. Abbiamo motivo di …
Ho una domanda in cui si chiede di verificare se la distribuzione uniforme ( Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) ) è normalizzata. Per uno, cosa significa normalizzare qualsiasi distribuzione? E due, come possiamo verificare se una distribuzione è normalizzata o no? Capisco calcolando X−meansdX−meansd \frac{X-\text{mean}}{\text{sd}} otteniamodatinormalizzati, ma qui ci viene chiesto di verificare …
Ehi ragazzi, ho trovato uno o due documenti che usano la regressione della cresta (per i dati sul basket). Mi è stato sempre detto di standardizzare le mie variabili se ho eseguito una regressione della cresta, ma mi è stato semplicemente detto di farlo perché la cresta era una variante …
In generale, standardizzo le mie variabili indipendenti nelle regressioni, al fine di confrontare correttamente i coefficienti (in questo modo hanno le stesse unità: deviazioni standard). Tuttavia, con i dati panel / longitudinali, non sono sicuro di come standardizzare i miei dati, soprattutto se valuto un modello gerarchico. Per capire perché …
Prendi in considerazione la regressione lineare con una certa regolarizzazione: ad esempio Trova che minimizza| | A x - b | | 2 + λ | | x | | 1xxx||Ax−b||2+λ||x||1||Ax−b||2+λ||x||1||Ax - b||^2+\lambda||x||_1 Di solito, le colonne di A sono standardizzate per avere media zero e norma unitaria, mentre è …
Le mie variabili di input hanno dimensioni diverse. Alcune variabili sono decimali mentre altre sono centinaia. È essenziale centrare (sottrarre media) o ridimensionare (dividere per deviazione standard) queste variabili di input al fine di rendere i dati senza dimensioni quando si utilizza la foresta casuale?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.