Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

1
Due modi di utilizzare bootstrap per stimare l'intervallo di confidenza dei coefficienti in regressione
Sto applicando un modello lineare ai miei dati: yio= β0+ β1Xio+ ϵio,εio~ N( 0 , σ2) .yio=β0+β1Xio+εio,εio~N(0,σ2). y_{i}=\beta_{0}+\beta_{1}x_{i}+\epsilon_{i}, \quad\epsilon_{i} \sim N(0,\sigma^{2}). Vorrei stimare l'intervallo di confidenza (CI) dei coefficienti ( β0β0\beta_{0} , β1β1\beta_{1} ) usando il metodo bootstrap. Esistono due modi in cui posso applicare il metodo bootstrap: Esempio di …

1
Quale funzione potrebbe essere un kernel?
Nel contesto dell'apprendimento automatico e del riconoscimento di modelli, esiste un concetto chiamato Kernel Trick . Di fronte a problemi in cui mi viene chiesto di determinare se una funzione potrebbe essere una funzione del kernel o meno, cosa si dovrebbe fare esattamente? Dovrei prima verificare se hanno la forma …

3
Come calcolare la bontà di adattamento in glm (R)
Ho il seguente risultato dall'esecuzione della funzione glm. Come posso interpretare i seguenti valori: Deviazione nulla Devianza residua AIC Hanno qualcosa a che fare con la bontà di adattarsi? Posso calcolare la bontà della misura di adattamento da questi risultati come R-quadrato o qualsiasi altra misura? Call: glm(formula = tmpData$Y …

2
Interpretazione naturale per iperparametri LDA
Qualcuno può spiegare qual è la naturale interpretazione degli iperparametri LDA? ALPHAe BETAsono parametri delle distribuzioni di Dirichlet rispettivamente per (per documento) argomento e (per argomento). Tuttavia qualcuno può spiegare cosa significa scegliere valori più grandi di questi iperparametri rispetto a valori più piccoli? Ciò significa mettere delle credenze precedenti …


1
Ruolo del parametro n.minobsinnode di GBM in R [chiuso]
È improbabile che questa domanda aiuti eventuali futuri visitatori; è rilevante solo per una piccola area geografica, un momento specifico nel tempo o una situazione straordinariamente stretta che non è generalmente applicabile al pubblico mondiale di Internet. Per assistenza nel rendere questa domanda più ampiamente applicabile, visitare il centro assistenza …
21 r  gbm 

3
Come interpretare gli effetti principali quando l'effetto di interazione non è significativo?
Ho eseguito un modello misto lineare generalizzato in R e ho incluso un effetto di interazione tra due predittori. L'interazione non era significativa, ma gli effetti principali (i due predittori) erano entrambi. Ora molti esempi di libri di testo mi dicono che se c'è un effetto significativo dell'interazione, gli effetti …




2
Perché una
sfondo Uno dei punti deboli più comunemente usati prima della varianza è la gamma inversa con i parametri (Gelman 2006) .α = 0,001 , β= 0,001α=0.001,β=0.001\alpha =0.001, \beta=0.001 Tuttavia, questa distribuzione ha un IC al 90% di circa .[ 3 × 1019, ∞ ][3×1019,∞][3\times10^{19},\infty] library(pscl) sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, …


2
PCA in numpy e sklearn produce risultati diversi
Sto fraintendendo qualcosa. Questo è il mio codice usando sklearn import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from sklearn import decomposition from sklearn import datasets from sklearn.preprocessing import StandardScaler pca = decomposition.PCA(n_components=3) x = np.array([ [0.387,4878, 5.42], [0.723,12104,5.25], [1,12756,5.52], [1.524,6787,3.94], ]) pca.fit_transform(x) Produzione: array([[ -4.25324997e+03, …



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.