Quando i dati presentano mancanza di informazioni (lacune), ovvero non sono completi. Pertanto, è importante considerare questa funzione quando si esegue un'analisi o un test.
Ho una tabella di dati T1, che contiene quasi un migliaio di variabili (V1) e circa 200 milioni di punti dati. I dati sono scarsi e la maggior parte delle voci sono NA. Ciascun punto dati ha un ID univoco e una coppia di date per distinguere da un altro. …
Contesto : regressione gerarchica con alcuni dati mancanti. Domanda : Come posso utilizzare la stima della massima verosimiglianza con le informazioni complete (FIML) per affrontare i dati mancanti in R? Esiste un pacchetto che consiglieresti e quali sono i passaggi tipici? Anche le risorse e gli esempi online sarebbero di …
Ho un set di dati sulle prove agricole. La mia variabile di risposta è un rapporto di risposta: log (trattamento / controllo). Sono interessato a ciò che media la differenza, quindi sto eseguendo meta-regressioni RE (non ponderate, perché sembra abbastanza chiaro che la dimensione dell'effetto non è correlata alla varianza …
Dati di base : ho ~ 1.000 persone contrassegnate con valutazioni: '1,' [buono] '2,' [medio] o '3' [cattivo] - questi sono i valori che cercherò di prevedere per le persone in futuro . Inoltre, ho alcune informazioni demografiche: sesso (categorico: M / F), età (numerico: 17-80) e razza (categorico: nero …
È stato esaminato un campione di popolazione casuale. È stato chiesto loro se seguivano una dieta vegetariana. Se hanno risposto di sì, è stato anche chiesto loro di specificare da quanto tempo hanno seguito una dieta vegetariana senza interruzione. Voglio usare questi dati per calcolare la durata media di aderenza …
Ho una vasta serie di dati sull'inquinamento che sono stati registrati ogni 10 minuti nel corso di 2 anni, tuttavia ci sono una serie di lacune nei dati (compresi alcuni che vanno per alcune settimane alla volta). I dati sembrano essere abbastanza stagionali e c'è una grande variazione durante il …
Sono impressionato dal forecastpacchetto R , come ad esempio il zoopacchetto per le serie temporali irregolari e l'interpolazione dei valori mancanti. La mia applicazione è nell'area delle previsioni sul traffico del call center, quindi i dati nei fine settimana mancano (quasi) sempre, che possono essere gestiti in modo corretto zoo. …
Sto sperimentando l'algoritmo della macchina per aumentare il gradiente tramite il caretpacchetto in R. Utilizzando un piccolo set di dati di ammissione al college, ho eseguito il seguente codice: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- …
I test di permutazione (chiamati anche test di randomizzazione, test di ri-randomizzazione o test esatto) sono molto utili e sono utili quando l'assunzione della distribuzione normale richiesta da per esempio t-testnon è soddisfatta e quando la trasformazione dei valori per classifica del test non parametrici come Mann-Whitney-U-testquesto porterebbero alla perdita …
So che potrebbe essere un po 'complicato, statisticamente, ma questo è il mio problema. Ho molti dati di intervallo, vale a dire la dimensione minima, massima e di campionamento di una variabile. Per alcuni di questi dati ho anche una media, ma non molti. Voglio confrontare questi intervalli tra loro …
Non sembra esserci un modo standard per gestire i dati mancanti nel contesto della famiglia di modelli di livellamento esponenziale. In particolare, l'implementazione di R chiamata ets nel pacchetto di previsione sembra prendere solo la sottosequenza più lunga senza dati mancanti, e il libro "Previsioni con livellamento esponenziale" di Hyndman …
Quali sono alcuni approcci per classificare i dati con un numero variabile di funzionalità? Ad esempio, considera un problema in cui ogni punto dati è un vettore di punti xey e non abbiamo lo stesso numero di punti per ogni istanza. Possiamo considerare ogni coppia di punti xey come una …
Ho avuto queste due spiegazioni più volte. Continuano a cucinarmi il cervello. Mancare non a caso ha senso essere, e perdere completamente a caso ha senso ... è la mancanza a caso che non è così tanto. Cosa dà origine a dati che sarebbero MAR ma non MCAR?
Vorrei usare l'imputazione per sostituire i valori mancanti nel mio set di dati con determinati vincoli. Ad esempio, vorrei che la variabile imputata x1fosse maggiore o uguale alla somma delle mie altre due variabili, diciamo x2e x3. Voglio anche x3essere imputato da uno 0o >= 14e voglio x2essere imputato da …
Sto leggendo la costruzione di modelli multivariabili: un approccio pragmatico all'analisi della regressione basata su polinomi frazionari per la modellazione di variabili continue di Patrick Royston e Willie Sauerbrei. Finora sono rimasto impressionato ed è un approccio interessante che non avevo mai considerato prima. Ma gli autori non si occupano …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.