Quando i dati presentano mancanza di informazioni (lacune), ovvero non sono completi. Pertanto, è importante considerare questa funzione quando si esegue un'analisi o un test.
Voglio determinare quale di due serie di dati (B1, B2) sia meglio correlata (pere r) a un'altra serie (A). Mancano dati in tutti i set di dati. Come posso determinare se la correlazione risultante è significativamente diversa o no? Ad esempio 8426 valori sono presenti sia in A che in …
Sto lavorando a una meta-analisi di effetti casuali che copre una serie di studi che non riportano deviazioni standard; tutti gli studi riportano la dimensione del campione. Non credo che sia possibile approssimare o imputare i dati mancanti SD. In che modo una meta-analisi che utilizza differenze grezze (non standardizzate) …
Sto cercando di capire come potrei modellare al meglio una variabile in cui nel tempo ho ottenuto predittori sempre più dettagliati. Ad esempio, prendere in considerazione la modellizzazione dei tassi di recupero sui prestiti inadempienti. Supponiamo di avere un set di dati con 20 anni di dati e nei primi …
Ho un randomForestmodello di classificazione che vorrei utilizzare in un'applicazione che prevede la classe di un nuovo caso. Il nuovo caso ha inevitabilmente valori mancanti. Predict non funzionerà come tale per i NA. Come dovrei farlo allora? data(iris) # create first the new case with missing values na.row<-45 na.col<-c(3,5) case.na<-iris[na.row,] …
Supponiamo di avere un campione di frequenze di 4 possibili eventi: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 e ho le probabilità attese dei miei eventi: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Con la somma delle frequenze osservate dei …
Supponiamo che ci venga fornito un insieme di dati del modulo e . Ci viene assegnato il compito di prevedere base ai valori di . Stimiamo due regressioni in cui: ( y , x 1 , x 2 , ⋯ , x n - 1 ) y x y( y, …
Ho una serie temporale di misurazioni (altezze-una serie dimensionale). Nel periodo di osservazione, il processo di misurazione è andato giù per alcuni punti temporali. Quindi i dati risultanti sono un vettore con NaN in cui vi erano lacune nei dati. Usando MATLAB, questo mi sta causando un problema durante il …
Sto modellando la previsione del diabete usando la regressione logistica. Il set di dati utilizzato è il Behavioral Risk Factor Surveillance System (BRFSS) del Center for Disease Control (CDC). Una delle variabili indipendenti è la pressione alta. È categorico con i seguenti livelli "Sì", "No", "Non so / Rifiutato". Devo …
In un problema su cui sto lavorando, ho due variabili casuali, X e Y. Devo capire quanto siano strettamente correlate tra loro, ma hanno dimensioni diverse. Il rango dello spazio di riga di X è 4350 e il rango dello spazio di riga di Y è sostanzialmente più grande, nelle …
Semplificando un po ', ho circa un milione di dischi che registrano il tempo di entrata e di uscita delle persone in un sistema che dura da circa dieci anni. Ogni record ha un orario di entrata, ma non tutti i record hanno un tempo di uscita. Il tempo medio …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.