Usa questo tag per qualsiasi domanda * sull'argomento * che (a) coinvolga `R` come parte critica della domanda o risposta prevista, e (b) non è * solo * su come usare` R`.
La mia domanda è generalmente sulla decomposizione del valore singolare (SVD), e in particolare sull'indicizzazione semantica latente (LSI). Di ', ho che contiene frequenze di 5 parole per 7 documenti.Aword×documentUNword×document A_{word \times document} A = matrix(data=c(2,0,8,6,0,3,1, 1,6,0,1,7,0,1, 5,0,7,4,0,5,6, 7,0,8,5,0,8,5, 0,10,0,0,7,0,0), ncol=7, byrow=TRUE) rownames(A) <- c('doctor','car','nurse','hospital','wheel') Ho la fattorizzazione matrice usando …
Sono interessato a stimare un rapporto di rischio rettificato, analogo a come si stima un rapporto di probabilità rettificato utilizzando la regressione logistica. Alcune pubblicazioni (ad esempio, questo ) indicano che l'uso della regressione di Poisson con errori standard di Huber-White è un modo basato su modelli per farlo Non …
Sto lavorando alla convalida incrociata della previsione dei miei dati con 200 soggetti e 1000 variabili. Sono interessato alla regressione della cresta poiché il numero di variabili (che voglio usare) è maggiore del numero del campione. Quindi voglio usare gli stimatori di contrazione. Di seguito sono riportati i dati di …
Sto inserendo un glmermodello nel lme4pacchetto R. Sto cercando una tabella anova con il valore p mostrato al suo interno, ma non riesco a trovare nessun pacchetto adatto. È possibile farlo in R? Il modello che sto adattando ha la forma: model1<-glmer(dmn~period*teethTreated+(1|fullName), family="poisson", data=subset(dataset, group=='Four times a year'), control=glmerControl(optimizer="bobyqa"))
Ho un set di dati di circa 5000 funzionalità. Per quei dati ho usato per la prima volta il test Chi Square per la selezione delle caratteristiche; successivamente, ho ottenuto circa 1500 variabili che mostravano una relazione significativa con la variabile response. Ora devo adattarmi alla regressione logistica su questo. …
Per impostazione predefinita, quando utilizziamo una glmfunzione in R, utilizza il metodo IWLS (reimpostazione dei minimi quadrati ripetutamente iterativamente) per trovare la stima della massima verosimiglianza dei parametri. Ora ho due domande. Le stime IWLS garantiscono il massimo globale della funzione di probabilità? Sulla base dell'ultima diapositiva di questa presentazione, …
Sto cercando di prevedere gruppi di articoli che qualcuno acquisterà ... cioè, ho più variabili dipendenti dal colore. Anziché creare 7 modelli indipendenti per prevedere la probabilità che qualcuno acquisti ciascuno dei 7 articoli e quindi combinare i risultati, quali metodi devo esaminare per avere un modello che tenga conto …
Sto lavorando agli esempi di Doing Bayesian Data Analysis di Kruschke , in particolare l'ANOVA esponenziale di Poisson in cap. 22, che presenta in alternativa ai test chi-quadrato di indipendenza per le tabelle di contingenza. Vedo come otteniamo informazioni sulle interazioni che si verificano più o meno frequentemente di quanto …
Ho un sacco di serie temporali con periodi: giorno, settimana o mese. Con la stl()funzione o con loess(x ~ y)posso vedere come appaiono le tendenze di particolari serie storiche. Devo rilevare se la tendenza delle serie temporali è in aumento o in diminuzione. Come posso gestirlo? Ho provato a calcolare …
Voglio adattare un DLM con coefficienti variabili nel tempo, ovvero un'estensione alla solita regressione lineare, .yt=θ1+θ2x2yt=θ1+θ2x2y_t = \theta_1 + \theta_2x_2 Ho un predittore ( ) e una variabile di risposta ( y t ), rispettivamente catture ittiche marine e interne dal 1950 al 2011. Voglio seguire il modello di regressione …
Sto guardando un foglio Excel che afferma di calcolare il , ma non riconosco questo modo di farlo, e mi chiedevo se mi mancasse qualcosa.χ2χ2\chi^2 Ecco i dati che sta analizzando: +------------------+----------+----------+ | Total Population | Observed | Expected | +------------------+----------+----------+ | 2000 | 42 | 32.5 | | 2000 …
Un mio collega mi ha inviato questo problema apparentemente facendo il giro su Internet: If $3 = 18, 4 = 32, 5 = 50, 6 = 72, 7 = 98$, Then, $10 =$ ? La risposta sembra essere 200. 3*6 4*8 5*10 6*12 7*14 8*16 9*18 10*20=200 Quando eseguo una …
Sono nuovo nelle statistiche e sto cercando di capire la differenza tra ANOVA e regressione lineare. Sto usando R per esplorare questo. Ho letto vari articoli sul perché ANOVA e la regressione sono diversi ma sempre uguali e come possono essere visualizzati ecc. Penso di essere abbastanza lì, ma manca …
Voglio valutare l'accuratezza dei test di normalità su diverse dimensioni del campione in R (mi rendo conto che i test di normalità possono essere fuorvianti ). Ad esempio, per esaminare il test di Shapiro-Wilk, sto conducendo la seguente simulazione (oltre a tracciare i risultati) e mi aspetterei che quando la …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.