Ho esaminato la documentazione di sklearn ma non sono in grado di comprendere lo scopo di queste funzioni nel contesto della regressione logistica. Perché decision_functiondice che è la distanza tra l'iperpiano e l'istanza di test. come sono utili queste informazioni particolari? e in che modo ciò si collega predicte predict-probametodi?
Sono confuso su come valutare la distribuzione predittiva posteriore per la regressione lineare bayesiana, oltre il caso di base descritto qui a pagina 3 e copiato di seguito. p ( y~∣ y) = ∫p ( y~∣ β, σ2) p ( β, σ2∣ y)p(y~∣y)=∫p(y~∣β,σ2)p(β,σ2∣y) p(\tilde y \mid y) = \int p(\tilde …
Le stime di deviazione standard sono calcolate tramite: sN=1N∑Ni=1(xi−x¯¯¯)2−−−−−−−−−−−−−√.sN=1N∑i=1N(xi−x¯)2. s_N = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}. ( http://en.wikipedia.org/wiki/Standard_deviation#Sample_standard_deviation ) per la precisione delle previsioni campionata da 10 volte la convalida incrociata? Sono preoccupato che l'accuratezza della previsione calcolata tra ciascuna piega dipenda dalla sostanziale sovrapposizione tra le serie di allenamento …
Sono un nuovo utente di WinBUGS e ho una domanda per il tuo aiuto. Dopo aver eseguito il codice seguente, ho ottenuto i parametri di beta0through beta4(stats, densità), ma non so come ottenere la previsione dell'ultimo valore di h, che ho impostato NAper modellare nel codice. Qualcuno può darmi un …
Questo è solo un esempio che ho riscontrato più volte, quindi non ho dati di esempio. Esecuzione di un modello di regressione lineare in R: a.lm = lm(Y ~ x1 + x2) x1è una variabile continua. x2è categorico e ha tre valori, ad esempio "Basso", "Medio" e "Alto". Tuttavia, l'output …
Hastie et al. "The Elements of Statistical Learning" (2009) considera un processo di generazione di dati con e .E ( ε ) = 0 Var ( ε ) = σ 2 εY=f(X)+εY=f(X)+ε Y = f(X) + \varepsilon E(ε)=0E(ε)=0\mathbb{E}(\varepsilon)=0Var(ε)=σ2εVar(ε)=σε2\text{Var}(\varepsilon)=\sigma^2_{\varepsilon} Presentano la seguente decomposizione della variazione di polarizzazione dell'errore di previsione al …
Provo a prevedere un punteggio di equilibrio e ho provato diversi metodi di regressione. Una cosa che ho notato è che i valori previsti sembrano avere una sorta di limite superiore. Cioè, il saldo effettivo è in , ma le mie previsioni sono in cima a circa . Il diagramma …
Sto lavorando alla convalida incrociata della previsione dei miei dati con 200 soggetti e 1000 variabili. Sono interessato alla regressione della cresta poiché il numero di variabili (che voglio usare) è maggiore del numero del campione. Quindi voglio usare gli stimatori di contrazione. Di seguito sono riportati i dati di …
Sto prendendo un corso di introduzione a Bayes e ho qualche difficoltà a capire le distribuzioni predittive. Capisco perché sono utili e ho familiarità con la definizione, ma ci sono alcune cose che non capisco bene. 1) Come ottenere la giusta distribuzione predittiva per un vettore di nuove osservazioni Supponiamo …
Ho un modello dinamico Naive Bayes addestrato su un paio di variabili temporali. L'output del modello è la previsione di P(Event) @ t+1, stimata a ciascuno t. La trama di P(Event)versus timeè come mostrato nella figura sotto. In questa figura, la linea nera rappresenta P(Event)come previsto dal mio modello; la …
Ho un randomForestmodello di classificazione che vorrei utilizzare in un'applicazione che prevede la classe di un nuovo caso. Il nuovo caso ha inevitabilmente valori mancanti. Predict non funzionerà come tale per i NA. Come dovrei farlo allora? data(iris) # create first the new case with missing values na.row<-45 na.col<-c(3,5) case.na<-iris[na.row,] …
Supponiamo di avere un campione di frequenze di 4 possibili eventi: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 e ho le probabilità attese dei miei eventi: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Con la somma delle frequenze osservate dei …
Ho calcolato un semplice modello di regressione lineare dalle mie misure dell'esperimento per fare previsioni. Ho letto che non dovresti calcolare le previsioni per i punti che si discostano troppo dai dati disponibili. Tuttavia, non sono riuscito a trovare alcuna guida per aiutarmi a sapere fino a che punto posso …
So che questa è probabilmente una domanda di base ... Ma non sembra trovare la risposta. Sto adattando un GLM con una famiglia Poisson, quindi ho cercato di dare un'occhiata alle previsioni, tuttavia l'offset sembra essere preso in considerazione: model_glm=glm(cases~rhs(data$year,2003)+lhs(data$year,2003), offset=(log(population)), data=data, subset=28:36, family=poisson()) predict (model_glm, type="response") Ottengo casi non …
Avrebbe senso sovralimentare un modello di proposito? Supponiamo di avere un caso d'uso in cui so che i dati non varieranno molto rispetto ai dati di addestramento. Sto pensando qui alla previsione del traffico, in cui lo stato del traffico segue una serie fissa di schemi pendolarismo mattutino attività notturna …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.