Quando i dati presentano mancanza di informazioni (lacune), ovvero non sono completi. Pertanto, è importante considerare questa funzione quando si esegue un'analisi o un test.
Ho un set di dati molto grande e mancano circa il 5% di valori casuali. Queste variabili sono correlate tra loro. Il seguente set di dati R è solo un esempio di giocattolo con dati correlati fittizi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), …
Sto cercando di rilevare valori anomali in una serie temporale di dati climatici con alcune osservazioni mancanti. Cercando sul web ho trovato molti approcci disponibili. Di questi, la decomposizione stl sembra allettante, nel senso di rimuovere la tendenza e le componenti stagionali e studiare il resto. La lettura di STL: …
C'è una variabile nei miei dati con l'80% dei dati mancanti. I dati mancano a causa della inesistenza (ovvero della quantità di prestito bancario che la società deve). Mi sono imbattuto in un articolo in cui si afferma che il metodo di regolazione delle variabili fittizie è la soluzione a …
La mia domanda è rivolta alle tecniche per gestire dati incompleti durante la classificazione / l'addestramento / l'adattamento del modello. Ad esempio, in un set di dati con poche centinaia di righe, ogni riga con cinque dimensioni e un'etichetta di classe come ultimo elemento, la maggior parte dei punti di …
Ho questo enorme set di dati con 2500 variabili e 142 osservazioni. Voglio eseguire una correlazione tra la variabile X e il resto delle variabili. Ma per molte colonne mancano voci. Ho provato a farlo in R usando l'argomento "pairwise-complete" ( use=pairwise.complete.obs) e ha prodotto un sacco di correlazioni. Ma …
Di recente ho esaminato l'algoritmo XGBoost e ho notato che questo algoritmo può gestire i dati mancanti (senza richiedere imputazione) durante la fase di addestramento. Mi chiedevo se XGboost è in grado di gestire i dati mancanti (senza richiedere imputazione) quando viene utilizzato per prevedere nuove osservazioni o se è …
Sto usando "glmnet" per la regressione del lazo in GWAS. Alcune varianti e individui hanno valori mancanti e sembra che glmnet non sia in grado di gestire valori mancanti. C'è qualche soluzione per questo? o esiste un altro pacchetto in grado di gestire i valori mancanti nella regressione del lazo? …
Ho provato un metodo di previsione e voglio verificare se il mio metodo è corretto o meno. Il mio studio sta confrontando diversi tipi di fondi comuni di investimento. Voglio utilizzare l'indice GCC come punto di riferimento per uno di essi, ma il problema è che l'indice GCC si è …
Non ho mai trovato buoni testi o esempi su come gestire i dati "inesistenti" per gli input in qualsiasi tipo di classificatore. Ho letto molto sui dati mancanti, ma cosa si può fare per i dati che non possono o non esistono in relazione agli input multivariati. Capisco che questa …
Ho il seguente problema: - Abbiamo impostato N persone - Abbiamo impostato K immagini - Ogni persona valuta un certo numero di immagini. Ad una persona potrebbe piacere o meno un'immagine (queste sono le uniche due possibilità). - Il problema è come calcolare la probabilità che ad una persona piaccia …
Il mgcvpacchetto per Rha due funzioni per adattare le interazioni del prodotto tensore: te()e ti(). Comprendo la divisione di base del lavoro tra i due (adattamento di un'interazione non lineare rispetto alla scomposizione di questa interazione in effetti principali e un'interazione). Quello che non capisco è perché te(x1, x2)e ti(x1) …
La ponderazione basata sulla precisione è fondamentale per la meta-analisi? Borenstein et al. (2009) scrivono che per rendere possibile la meta-analisi tutto ciò che è necessario è che: Gli studi riportano una stima puntuale che può essere espressa come un singolo numero. La varianza può essere calcolata per quella stima …
Mi chiedo se qualcuno potrebbe fornire alcune informazioni su se un motivo per cui l'imputazione per i dati mancanti è migliore della semplice costruzione di modelli diversi per i casi con dati mancanti. Soprattutto nel caso di modelli lineari [generalizzati] (posso forse vedere in casi non lineari che le cose …
Ho un GLMM del modulo: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), ottengo risultati diversi rispetto a quelli che utilizzo Anova(model, type="III")dal pacchetto auto o summary(model). Questi ultimi due danno le stesse risposte. Usando un mucchio di dati fabbricati, …
Gelman & Hill (2006) dicono: In Bugs, i risultati mancanti in una regressione possono essere gestiti facilmente includendo semplicemente il vettore di dati, i NA e tutti. I bug modellano esplicitamente la variabile di risultato, quindi è banale usare questo modello per, in effetti, imputare i valori mancanti ad ogni …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.