Usa questo tag per qualsiasi domanda * sull'argomento * che (a) coinvolga `R` come parte critica della domanda o risposta prevista, e (b) non è * solo * su come usare` R`.
Sto usando il pacchetto party in R con 10.000 righe e 34 funzionalità e alcune funzionalità dei fattori hanno più di 300 livelli. Il tempo di elaborazione è troppo lungo. (Ci sono volute 3 ore finora e non è ancora finito.) Voglio sapere quali elementi hanno un grande effetto sul …
Durante la prima metà del 2015 ho seguito il corso di Machine Learning (di Andrew Ng, GRANDE corso). E imparato le basi dell'apprendimento automatico (regressione lineare, regressione logistica, SVM, reti neuronali ...) Inoltre sono uno sviluppatore da 10 anni, quindi imparare un nuovo linguaggio di programmazione non sarebbe un problema. …
Trasformo tutti i miei dati o le mie pieghe (se viene applicato il CV) contemporaneamente? per esempio (allData - mean(allData)) / sd(allData) Trasformo il set di treni e il set di test separatamente? per esempio (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Oppure trasformo il set di …
L'ho tracciato dopo aver fatto un test di normalità Shapiro-Wilk. Il test ha dimostrato che è probabile che la popolazione sia normalmente distribuita. Tuttavia, come vedere questo "comportamento" su questa trama? AGGIORNARE Un semplice istogramma dei dati: AGGIORNARE Il test Shapiro-Wilk dice:
Sto adattando una gloria binomiale della famiglia in R, e ho un'intera troupe di variabili esplicative, e ho bisogno di trovare il migliore (R al quadrato come misura va bene). A corto di scrivere una sceneggiatura per scorrere in modo casuale diverse combinazioni delle variabili esplicative e quindi registrare quale …
Sto programmando di iniziare a scrivere pacchetti R. Ho pensato che sarebbe stato utile studiare il codice sorgente dei pacchetti esistenti per apprendere le convenzioni sulla costruzione dei pacchetti. I miei criteri per i buoni pacchetti da studiare: Semplici idee statistiche / tecniche : il punto è conoscere la meccanica …
Ho dati di vendita per una serie di punti vendita e desidero categorizzarli in base alla forma delle loro curve nel tempo. I dati sono più o meno così (ma ovviamente non sono casuali e hanno alcuni dati mancanti): n.quarters <- 100 n.stores <- 20 if (exists("test.data")){ rm(test.data) } for …
La scrittura di Christopher Manning sulla regressione logistica in R mostra una regressione logistica in R come segue: ced.logr <- glm(ced.del ~ cat + follows + factor(class), family=binomial) Alcuni output: > summary(ced.logr) Call: glm(formula = ced.del ~ cat + follows + factor(class), family = binomial("logit")) Deviance Residuals: Min 1Q Median …
Mi chiedo se fa differenza nell'interpretazione se solo le variabili dipendenti, dipendenti e indipendenti, o solo le variabili indipendenti, vengono trasformate in log. Considera il caso di log(DV) = Intercept + B1*IV + Error Posso interpretare il IV come l'aumento percentuale, ma come cambia quando lo faccio log(DV) = Intercept …
So che mi manca qualcosa nella mia comprensione della regressione logistica e apprezzerei molto qualsiasi aiuto. Per quanto ho capito, la regressione logistica presuppone che la probabilità di un risultato "1" dato gli input, sia una combinazione lineare degli input, passata attraverso una funzione inversa-logistica. Questo è esemplificato nel seguente …
Esiste la possibilità di utilizzare R in un'interfaccia web senza la necessità di installarlo? Ho solo un piccolo script che mi piace eseguire ma voglio solo provarlo senza una lunga procedura di installazione. Grazie.
Che cos'è "Devianza", come viene calcolata e quali sono i suoi usi in diversi campi nelle statistiche? In particolare, sono personalmente interessato ai suoi usi in CART (e alla sua implementazione in rpart in R). Lo sto chiedendo poiché l' articolo wiki sembra in qualche modo carente e le tue …
In particolare, voglio sapere se c'è una differenza tra lm(y ~ x1 + x2)e glm(y ~ x1 + x2, family=gaussian). Penso che questo caso particolare di glm sia uguale a lm. Ho sbagliato?
La mia domanda principale è come interpretare l'output (coefficienti, F, P) quando si esegue un ANOVA di tipo I (sequenziale)? Il mio problema di ricerca specifico è un po 'più complesso, quindi spezzerò il mio esempio in parti. Innanzitutto, se sono interessato all'effetto della densità del ragno (X1) sulla crescita …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.