Statistiche e Big Data

1

Due modi di utilizzare bootstrap per stimare l'intervallo di confidenza dei coefficienti in regressione

Sto applicando un modello lineare ai miei dati: yio= β0+ β1Xio+ ϵio,εio~ N( 0 , σ2) .yio=β0+β1Xio+εio,εio~N(0,σ2). y_{i}=\beta_{0}+\beta_{1}x_{i}+\epsilon_{i}, \quad\epsilon_{i} \sim N(0,\sigma^{2}). Vorrei stimare l'intervallo di confidenza (CI) dei coefficienti ( β0β0\beta_{0} , β1β1\beta_{1} ) usando il metodo bootstrap. Esistono due modi in cui posso applicare il metodo bootstrap: Esempio di …

21 regression bootstrap

1

Quale funzione potrebbe essere un kernel?

Nel contesto dell'apprendimento automatico e del riconoscimento di modelli, esiste un concetto chiamato Kernel Trick . Di fronte a problemi in cui mi viene chiesto di determinare se una funzione potrebbe essere una funzione del kernel o meno, cosa si dovrebbe fare esattamente? Dovrei prima verificare se hanno la forma …

21 machine-learning kernel-trick

3

Come calcolare la bontà di adattamento in glm (R)

Ho il seguente risultato dall'esecuzione della funzione glm. Come posso interpretare i seguenti valori: Deviazione nulla Devianza residua AIC Hanno qualcosa a che fare con la bontà di adattarsi? Posso calcolare la bontà della misura di adattamento da questi risultati come R-quadrato o qualsiasi altra misura? Call: glm(formula = tmpData$Y …

21 r regression generalized-linear-model

2

Interpretazione naturale per iperparametri LDA

Qualcuno può spiegare qual è la naturale interpretazione degli iperparametri LDA? ALPHAe BETAsono parametri delle distribuzioni di Dirichlet rispettivamente per (per documento) argomento e (per argomento). Tuttavia qualcuno può spiegare cosa significa scegliere valori più grandi di questi iperparametri rispetto a valori più piccoli? Ciò significa mettere delle credenze precedenti …

21 interpretation prior topic-models hyperparameter

2

Quali distribuzioni hanno soluzioni in forma chiusa per la stima della massima verosimiglianza?

Quali distribuzioni hanno soluzioni in forma chiusa per le stime della massima verosimiglianza dei parametri da un campione di osservazioni indipendenti?

21 distributions mathematical-statistics maximum-likelihood

1

Ruolo del parametro n.minobsinnode di GBM in R [chiuso]

È improbabile che questa domanda aiuti eventuali futuri visitatori; è rilevante solo per una piccola area geografica, un momento specifico nel tempo o una situazione straordinariamente stretta che non è generalmente applicabile al pubblico mondiale di Internet. Per assistenza nel rendere questa domanda più ampiamente applicabile, visitare il centro assistenza …

21 r gbm

3

Come interpretare gli effetti principali quando l'effetto di interazione non è significativo?

Ho eseguito un modello misto lineare generalizzato in R e ho incluso un effetto di interazione tra due predittori. L'interazione non era significativa, ma gli effetti principali (i due predittori) erano entrambi. Ora molti esempi di libri di testo mi dicono che se c'è un effetto significativo dell'interazione, gli effetti …

21 logistic mixed-model interaction interpretation regression-coefficients

4

Analisi funzionale dei componenti principali (FPCA): di cosa si tratta?

L'analisi funzionale dei componenti principali (FPCA) è qualcosa su cui mi sono imbattuto e che non ho mai capito. Cos'è tutto questo? Vedi "Un sondaggio sull'analisi delle componenti principali funzionali" di Shang, 2011 , e sto citando: PCA incontra serie difficoltà nell'analizzare i dati funzionali a causa della "maledizione della …

21 time-series pca dimensionality-reduction

2

Una piccola dimensione del campione può causare errori di tipo 1?

Ho imparato che le dimensioni ridotte del campione possono portare a potenza insufficiente e errore di tipo 2. Tuttavia, ho la sensazione che piccoli campioni possano essere generalmente inaffidabili e possono portare a qualsiasi tipo di risultato per caso. È vero?

21 hypothesis-testing small-sample

3

Perché le variabili casuali sono definite come funzioni?

Sto riscontrando problemi nel comprendere il concetto di una variabile casuale come funzione. Capisco la meccanica (penso) ma non capisco la motivazione ... Dire è una tripla di probabilità, dove , è l'algebra di Borel- su quell'intervallo e è la normale misura di Lebesgue. Sia una variabile casuale da a …

21 probability random-variable measure-theory

2

Perché una

sfondo Uno dei punti deboli più comunemente usati prima della varianza è la gamma inversa con i parametri (Gelman 2006) .α = 0,001 , β= 0,001α=0.001,β=0.001\alpha =0.001, \beta=0.001 Tuttavia, questa distribuzione ha un IC al 90% di circa .[ 3 × 1019, ∞ ][3×1019,∞][3\times10^{19},\infty] library(pscl) sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, …

21 bayesian multilevel-analysis prior

3

La perdita di allenamento aumenta con il tempo [duplicato]

Questa domanda ha già risposte qui : In che modo la modifica della funzione di costo può essere positiva? (1 risposta) Cosa devo fare quando la mia rete neurale non impara? (5 risposte) Chiuso il mese scorso . Sto addestrando un modello (rete neurale ricorrente) per classificare 4 tipi di …

21 machine-learning neural-networks loss-functions rnn training-error

2

PCA in numpy e sklearn produce risultati diversi

Sto fraintendendo qualcosa. Questo è il mio codice usando sklearn import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from sklearn import decomposition from sklearn import datasets from sklearn.preprocessing import StandardScaler pca = decomposition.PCA(n_components=3) x = np.array([ [0.387,4878, 5.42], [0.723,12104,5.25], [1,12756,5.52], [1.524,6787,3.94], ]) pca.fit_transform(x) Produzione: array([[ -4.25324997e+03, …

21 pca python scikit-learn

2

Come funzionano le architetture di collo di bottiglia nelle reti neurali?

Definiamo un'architettura a collo di bottiglia come il tipo trovato nel documento ResNet in cui [due strati conv. 3x3] sono sostituiti da [un conv. 1x1, un conv. 3x3 e un altro livello conv. 1x1]. Capisco che gli strati conv di 1x1 sono usati come una forma di riduzione dimensionale (e …

21 residuals deep-learning conv-neural-network

1

Differenza tra modelli Markov nascosti e filtro antiparticolato (e filtro Kalman)

Ecco la mia vecchia domanda Vorrei chiedere se qualcuno conosce la differenza (se c'è qualche differenza) tra i modelli Hidden Markov (HMM) e Particle Filter (PF), e di conseguenza Kalman Filter, o in quali circostanze utilizziamo quale algoritmo. Sono uno studente e devo fare un progetto, ma prima devo capire …

21 machine-learning self-study hidden-markov-model kalman-filter particle-filter